格致方法.定量研究系列吴晓阿】主编 


分析重复调查数据 


[ 美 ] 格伦 • 菲尔鲍 （Glenn Firebaugh ) 著 

叶华译 


革新研究理念 

A 

丰富研究工具 

最权威、最前沿的定量研究方法指南 


格致出版社上海乂以成# 








【< 

世 IE 出版 

格致方法 • 定量研究系列 


1. 社会统计的数学基础 

2. 理解回归假设 

3. 虚拟变量回归 

4. 多元回归中的交互作用 

5. 回归诊断简介 

6. 现代稳健回归方法 

7. 固定效应回归模型 

8. 用面板数据做因果分析 

9. 多层次模型 

10. 分位数回归模型 

11. ' 空间回归模型 

12. 删截.选择性样本及截断数据的 
回归模型 

13. 应用 logistic ^ 归分析（第二版） 

14. logit 与 probit : 次序模型和多类别 
模型 

15. 定序因变量的 logistic 回归模型 

16. 对数线性模型 

17. 流动表分析 

18. 关联模型 


19. 中介作用分析 

20. 因子 分析： 统计方法与应用问题 

21. 非递归因果模型 

22. 评估不平等 

23. 分析复杂调查数据（第 二版） 

24. 分析重复调查数据 

25. 世代分析 

26. 纵贯研究 

27. 多元时间序列模型 

28. 潜变量增长曲线模型 

29. 缺失数据 

30. 社会网络分析 

31. 广义线性模型导论 

32. 基于行动者的模型 

33. 基于布尔代数的比较法导论 

34. 微分 方程： 一种建模方法 

35. 模糊集合理论在社会科学中的应用 

36. 图形代数 

37. 项目功能差异 


上架 建议： 社会研究方法 


ISBN 978-7-5432-2120-8 



9 787543 221208 


定价： 15.00 元 
易文网： www . ewen.cc 
格致网： www . hibooks.cn 
















格致方法.定量研究系列 吴晓刚主编 


分析重复调查数据 


[ 美 ] 格伦 • 菲尔鲍 (Glenn Firebaugh ) 著 

叶华译 



SAGE Publications ， Inc. 


格致出 版社蘭 上海入 A* 成相 


图书在版编目 （ cn >) 数据 


分析重复调查数据 /( 美)菲尔鲍 ( Firebaugh ， G .) 

著; 叶华译.一上海 :格致 出版社 :上海 人民出版社， 

2012 

(格致方法 • 定量研究系列） 

ISBN 978 - 7 - 5432 - 2120 - 8 

I. ①分… n. ①菲… ②叶… in. ① 社会调查-调 
查方法 N . ① C 915 

中国版本图书馆 CIP 数据核字 (2012) 第129147号 
责任编辑 王亚丽 


格致方法 • 定量研究系列 

分析重复调查数据 

[美]格伦 • 菲尔鲍著 
叶华译 


出 


版 


格致出版社 
世纪出版集团 WWW . hibooks.cn 
ww . ewen . cc 上海乂 〆 * * 相 

(200001 上海福建中路193号24层） 


I 

格&出《 


编辑部热线 021-63914988 
市场部热线 021-63914081 


发 行 世纪出版集团发行中心 

印 刷 浙江临安曙光印务有限公司 

开 本 920 X 1168 毫米1/32 

印 张 4 5 

字 数 85,000 

版 次 2012年7月第1版 

印 次 2012年7月第1次印刷 

ISBN 978 - 7 - 5432 - 2120 - 8 /C • 72 
定 价 15. 00元 



岀版说明 


由香港科技大学社会科学部吴晓刚教授主编的“格致方 
法* 定量研究系列”丛书，精选了世界著名的 SAGE 出版社 
定量社会科学研究丛书中的35种，翻译成中文，集结成八 
册，于2011年出版。这八册书分 别是： 《线性回归分析基 
础》、《高级回归分析》、《广义线性模型》、《纵贯数据分析》、 
《因果关系模型》、《社会科学中的数理基础及应用》、《数据分 
析方法五种》和《列表数据分析》。这套丛书自出版以来，受 
到广大读者特别是年轻一代社会科学工作者的欢迎，他们针 
对丛书的内容和翻译都提出了很多中肯的建议。我们对此 
表示衷心的感谢。 

基于读者的热烈反馈，同时也为了向广大读者提供更多 
的方便和选择，我们将该丛书以单行本的形式再次出版发行。 
在此过程中，主编和译者对已出版的书做了必要的修订和校 
正，还新增加了两个品种。此外，曾东林、许多多、范新光、李 
忠路协助主编参加了校订。今后我们将继续与 SAGE 出版社 
合作，陆续推出新的品种。我们希望本丛书单行本的出版能 
为推动国内社会科学定量研究的教学和研究作出一点贡献。 




总序 


往事如烟，光阴如梭。转眼间，出国已然十年有余。 
1996年赴美留学，最初选择的主攻方向是比较历史社会学， 
研究的兴趣是中国的制度变迁问题。以我以前在国内所受 
的学术训练，基本是看不上定量研究的。一方面，我们倾向 
于研究大问题，不喜欢纠缠于细枝末节。国内一位老师的 
话给我的印象很深，大致是说 ：如果 你看到一堵墙就要倒 
了，还用得着纠缠于那堵墙的倾斜角度究竟是几度吗？所 
以，很多研究都是大而化之，只要说得通 即可。 另一方面， 
国内（十年前）的统计教学，总的来说与社会研究中的实际 
问题是相脱节的。结果是，很多原先对定量研究感兴趣的 
学生在学完统计之后，依旧无从下手，逐渐失去了对定量研 
究的兴趣。 

我所就读的美国加州大学洛杉矶分校社会学系，在定量 
研究方面有着系统的博士训练课程。不论研究兴趣是定量 
还是定性的，所有的研究生第一年的头两个学期必须修两门 
中级统计课，最后一个学期的系列课程则是简单介绍线性回 
归以外的其他统计方法，是选修课。希望进一步学习定量研 
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究方法的可以在第二年修读另外一个三学期的系列课程，其 
中头两门课叫“调查数据分析”，第三门叫“研究设计”。除此 
以外，还有如“定类数据分析”、“人口学方法与技术”、“事件 
史分析”、“多层线性模型”等专门课程供学生选修。该学校 
的统计系、心理系、教育系、经济系也有一批蜚声国际的学 
者，提供不同的、更加专业化的课程供学生选修。2001年完 
成博士学业之后，我又受安德鲁 • 梅隆基金会资助,在世界 
定量社会科学研究的重镇密歇根大学从事两年的博士后研 
究，其间旁听谢宇教授为博士生讲授的统计课程，并参与该 
校社会研究院 (Institute for Social Research ) 定量社会研究方 
法项目的一些讨论会，受益良多。 

2003年，我赴港工作，在香港科技大学社会科学部，教授 
研究生的两门核心定量方法课程。香港科技大学社会科学 
部自创建以来，非常重视社会科学研究方法论的训练。我开 
设的第一门课“社会科学里的统计学 ” （Statistics for Social 
Science ) 为所有研究型硕士生和博士生的必修课，而第二门 
课“社会科学中的定量分析”为博士生的必修课(事实上，大 
部分硕士生在修完第一门课后都会继续选修第二门课）。我 
在讲授这两门课的时候，根据社会科学研究生的数理基础比 
较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的 
例子，结合语言和图形，帮助学生理解统计的基本概念和模 
型。课程的重点放在如何应用定量分析模型研究社会实际 
问题上，即社会研究者主要为定量统计方法的“消费者”而非 
“生产者”。作为“消费者”，学完这些课程后，我们一方面能 
够读懂、欣赏和评价别人在同行评议的刊物上发表的定量研 
究的 文章; 另一方面，也能在自己的研究中运用这些成熟的 



方法论技术。 

上述两门课的内容，尽管在线性回归模型的内容上有 
少量重复，但各有侧重。“社会科学里的统计学 ” （Statistics 
for Social Science ) 从介绍最基本的社会研究方法论和统计 
学原理开始，到多元线性回归模型结束，内容涵盖了描述性 
统计的基本方法、统计推论的原理、假设检验、列联表分析、 
方差和协方差分析、简单线性回归模型、多元线性回归模 
型，以及线性回归模型的假设和模型诊断。“社会科学中 
的定量分析”则介绍在经典线性回归模型的假设不成立的 
情况下的一些模型和方法，将重点放在因变量为定类数据 
的分析模型上，包括两分类的 logistic 回归模型、多分类 lo ¬ 
gistic 回归模型、定序 logistic 回归模型、条件 logistic 回归模 
型、多维列联表的对数线性和对数乘积模型、有关删节数据 
的模型、纵贯数据的分析模型，包括追踪研究和事件史的分 
析方法。这些模型在社会科学研究中有着更加广泛的 
应用。 

修读过这些课程的香港科技大学的研究生 ，一 直鼓励 
和支持我将两门课的讲稿结集出版，并帮助我将原来的英 
文课程讲稿译成了中文。但是，由于种种原因，这两本书拖 
了四年多还没有完成。世界著名的出版社 SAGE 的“定量 
社会科学研究”丛书闻名遐迩，每本书都写得通俗易懂。中 
山大学马駿教授向格致出版社何元龙社长推荐了这套书， 
当格致出版社向我提出从这套丛书中精选一批翻译，以繪 
中文读者时，我非常支持这个想法，因为这从某种程度上弥 
补了我的教科书未能出版的遗憾。 

翻译是一件吃力不讨好的事。不但要有对中英文两种 
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语言的精准把握能力，还要有对实质内容有较深的理解能 
力，而这套丛书涵盖的又恰恰是社会科学中技术性非常强 
的内容，只有语言能力是远远不能胜 任的。 在短短的一年 
时间里，我们组织了来自中国内地及港台地区的二十几位 
研究生参与了这项工程，他们目前大部分是香港科技大学 
的硕士和博士研究生，受过严格的社会科学统计方法的训 
练，也有来自美国等地对定量研究感兴趣的博士研究生。 
他 们是： 

香港科技大学社会科学部博士研究生蒋勤、李骏、盛智 
明、叶华、张卓妮、郑冰岛，硕士研究生贺光烨、李兰、林毓玲、 
肖东亮、辛济云、於嘉、余珊珊，应用社会经济研究中心研究 
员李 俊秀; 香港大学教育学院博士研究生洪 岩璧; 北京大学 
社会学系博士研究生李丁、赵 亮员； 中国人民大学人口学系 
讲师巫 锡炜； 中国台湾“中央”研究院社会学所助理研究员林 
宗弘;南京师范大学心理学系副教授 陈陈; 美国北卡罗来纳 
大学教堂山分校社会学系博士候选人姜 念涛; 美国加州大学 
洛杉矶分校社会学系博士研究生宋曦。 

关于每一位译者的学术背景，书中相关部分都有简单 
的介绍。尽管每本书因本身内容和译者的行文风格有所差 
异，校对也未免挂一漏万，术语的标准译法方面还有很大的 
改进空间，但所有的参与者都做了最大的努力，在繁忙的学 
习和研究之余，在不到一年的时间内，完成了三十五本书、 
超过百万字的翻译任务。李骏、叶华、张卓妮、贺光烨、宋 
曦、於嘉、郑冰岛和林宗弘除了承担自己的翻译任务之外， 
还在初稿校对方面付出了大量的劳动。香港科技大学霍英 
东南沙研究院的工作人员曾东林，协助我通读了全稿，在此 



我也致以诚挚的谢意。有些作者，如香港科技大学黄善国 
教授、美国约翰 • 霍普金斯大学郝令昕教授，也参与了审校 
工作。 

我们希望本丛书的出版，能为建设国内社会科学定量研 
究的扎实学风作出一点贡献。 


吴晓刚 

于香港九龙清水湾 



序 


调査研究是一项正在迅速兴起的课题，我们的丛书通过 
几本小册子来促进其发展。这些有价值的介绍实际上假定 
研究者只进行单次调査，成千上万的调查都是这么进行的。 
在20世纪末，我们发现很多“单次”调査实际上被重复了许 
多次。重复调查，用菲尔鲍的话来说，就是“向不同的样本询 
问同样的问题”。众所周知的例子有美国的综合社会调查、 
全国选举研究和全国健康访问调査。在相当长的一段时间 
里，这些调査定期对新抽取的全国样本询问相同的问题。举 
例来说，从1952年起，美国全国选举研究在每次议会和总统 
选举时都询问大量有关政治态度和行为的问题。 

这种重复调查给研究者提供了更多的机会，把社会作为 
整体来研究它的变迁。它们允许研究者转变关注点，从对个 
人层次的微观过程的研究，转为对整体层次的宏观过程的研 
究。菲尔鲍详细解说了用这种方式研究社会变迁的不同方 
法。为了提供一个一般化的理论取向，首先他尽力解决了怎 
么分解世代、时期和年龄作用。例如，有人发现，从前越南战 
争的抗议者对战争的支持度增长了。为什么会这样？这是 
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一种时期作用吗？例如，社会整体上对战争的容忍度提高 
了？或者这是一种年龄作用吗？年长化会让人更倾向于接 
受战争？抑或这是一种世代效应，例如，出生在1950年之后 
的人是否对战争的支持度更髙？由于识别上的困难，这些作 
用很难区分。在注重理论的背景下，菲尔鲍对克服这个困难 
的方法进行了深人的讨论。 

被重复进行过的调査通常允许对总体趋势进行有意义 
的研究。举例来说，假设在一系列调査中，我们用同样的方 
法对公众支持战争的态度进行了测量，分析变迁的研究者可 
以绘图来展现该趋势。此外，也可以对社会中的不同群体进 
行比较，例如，比较越南战争的抗议者和非抗议者。菲尔鲍 
用真实数据展示了如何估计群体在趋势上的差异，并令人信 
服地探讨了年轻的和年长的美国人在社会开支态度上的差 
别。其总体趋势可以被分解，即把总变迁归因于个人的变化 
或者人口群体的变化。这被称为“近似分解”，可以通过回归 
或者代数的方法进行。作为一个例子，菲尔鲍分解了从1972 
年到1984年反对歧视黑人的趋势的变化，结果表明，相对于 
个人变化的影响来说，总变化稍微更多地来自世代更替的 
影响。 

对总体趋势的分解可用于解释，而不仅仅是描述。用回 
归的形式，可以把总体趋势分解为因果性的组成部分，它包 
括截距的变化、自变量本身的变化和自变量斜率的变化。为 
了展示更一般的分解方法，菲尔鲍分析了美国选举投票率的 
变化趋势，并提出了有益的警告且进行了解释，反对机械地 
运用这个方法。 

与研究总体变化相对应，第6章用参数变化模型研究重 



复调査，此时在个人层次上，自变量 X 对因变量 Y 的作用随 
时间而变化。重复调查被合并或者说累积成一个数据用于 
分析。作者细心地选择了美国选举研究数据作为例子，研究 
影响政党认同的主要因素的变化，例如地区、教育、种族和 
阶级。 

总的来说，作者讨论了重复调査的四种基本 用途: 描述、 
分解、解释总体趋势，以及对个别参数变化的估计。对重复 
调査的系统性运用将大大地扩展研究变迁的可能性。菲尔 
鲍的这篇论述清晰、独一无二的出版物是这个迅速发展的研 
究领域的一个无价的指引。 


迈克尔 • S . 刘易斯一贝克 
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分析 重复 调査 败据 


第1节 I 重复调查:相同的问題， 
不同的样本 


重复调査即向不同样本的受访者提问相同的问题。因 
为新的样本在各个不同的测量时期被挑选出来，所以重复调 
査设计的另一个名称是“重复截面设计” （ Menard ， 1991)。 
有一些调査以一定的时间间隔(通常是每月、每季、每年或每 
两年)重复进行，邓肯和卡顿称之为“定期调査 ” （Duncan & 
Kalton , 1987)。其他调査，例如选举前的民意调査，其重复 
是临时性的。就研究社会变迁而言，亦即本书的重点，定期 
调査是最容易分析的。 

要区分重复调查设计(跨时间的不同样本）和固定样本 
研究设计(多次调査相同的受访者），重要的是谨记术语“固 
定样本”和“重复调査”指的是抽样设计的实质。有些固定样 
本研究定期加人新样本,有些重复调查包含固定样本，所以 
术语“重复调査”不一定暗示每次调査都是全新的样本。再 
访以前的受访者通常会比抽取和访问新的受访者要容易和 
便宜，尤其是当再访可以通过电话完成的时候。再访使得研 
究个体随时间的变化成为可能，因为这些个体可以被追踪。 

全国性的重复调査已经成为过去20多年美国社会科学 
研究的主要工具。在这些重复调查中，最广为人知的也许就 
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是美国综合社会调査 ( GSS ), —项每年 （1994 年后改为每两 
年)进行的、涵盖48个接壤州①、非制度化的 @ 成年人总体的面 
访。从1972年的首次调查算起，已经有超过32000位受访者回 
答了大约1500个涵盖了态度、信仰和行为的众多不同问题。 
如此搜集而来的数据已经成为社会科学研究的全国性资源。 

在过去的20多年中，综合社会调査无疑已经成为社会科 
学领域除美国人口普查以外被使用得最多的数据。此外，综 
合社会调查也被广泛用于教学。已有专门的软件被开发出来 
用于教授社会学专业学生使用综合社会调査，据估计，每年有 
超过10万个社会学专业的学生在课堂中使用综合社会调査。 

虽然综合社会调查是“唯一的保证问题会重复的美国调 
查 ” (Davis & Snuth , 1992: 1) ,但其他全国性的定期调査的 
每次调査中也包含了相当多的重复问题。这些调査包 括:全 
国选举研究 ( NES )， 它自1952年起每两年都有可用的 数据； 
全国健康访问调查 ( NHIS ), 从1957年起每年搜集 数据; 人 
口现状调査 ( CPS ) ，这是一项基于轮换固定样本设计的、每月 
进行的、关于工作参与的调查。此外，偶然的民意调査，例如 
哥伦比亚广播公司与《纽约时报》的民意调査，也经常有重复 
的问题。其他有重复问题的重要数据还有消费者调查(密歇 
根调査研究中心），它的数据包含一些能追溯至1946年的问 
题。这些数据都可以从密歇根大学的校际政治与社会研究 
协会 ( ICPSR ) 得到„有兴趣的读者可以参考协会最新的目录 
以及基尔科特和纳森的研究 (Kiecolt Nathan , 1985), 查看 
关于可用于研究社会变迁的全国数据的更多介绍。 


① 即不包括阿拉斯加州和夏 威夷。 一译者注 

② 即不包括军队、学校等制度化组织。——译者注 



分析 重复调畫 数据 


2节 I 重 ft 调查与固定样本调查 


为了研究变化，我们必须在不同的时间测量相同的事 
物。重复调査是对不同的人群进行测量。固定样本调査对 
相同的人群进行重复测量，所以固定样本调査是长时间追踪 
个人，而重复调査是随时间变化追踪不同的世代（同年出生 
的人群）。 

哪个方法更好？对此没有一般性的结论，因为固定样本 
数据更适用于一些问题，而重复的截面数据更适用于另一些 
问题 (Duncan Kalton ， 1987)。假设我们想知道在里根任 
期内，共和党人对民主党人的比例在适龄投票人口中有没有 
提高，用对该群体的重复调查就可以直接估计这个比例。例 
如，用全国选举研究数据 （ Abramson、Aldrich &• Rohde , 
1994) ，我们估计这个比例从1980年的 0. 55( 在党派人士中， 
35. 4%是共和党人， 64. 6%是民主党人）提高到了 1988年的 
0. 78(43. 8%是共和党人， 56. 3%是民主党人）。即使它仅意 
味着共和党候选人在20世纪80年代末比80年代初有更大 
的支持基础，但这也是个引人注目的 提高。 然而要注意，共 
和党人和民主党人的百分比变化趋势并不能告诉我们在里 
根任期内，有多少人的政党支持发生了变化。在极端情况 
下，假设没有一个人的政党支持发生过变化，那么我们观察 
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到的共和党人对民主党人比例的全部提高就都来自世代更 
替(更老的、更倾向于民主党的世代被更年轻的、更倾向于共 
和党的世代代替）。在这种情况下，这个趋势夸大了政党支 
持的变化，实际上政党支持的变化为0。更可能的情况是，共 
和党人对民主党人比例的变化趋势低估了（而非髙估了）政 
党支持变化的比例，因为人们会向两个方向改变，而这种互 
相抵消的变动没有被总和比例所反映。 

由于重复调査不随时间跟踪个人，所以它们不能记录人 
们政党身份的“总变化”，也就是说，重复调査不能记录人们 
政党支持的实际变化率。重复调査记录的是“净变化”，即所 
有变化的净作用。 

由于固定样本调査随时间跟踪个人，所以它们提供了对 
世代总变化和净变化的估计。用固定样本数据估计总变化 
的可靠程度，取决于变化速度相对于测量间隔来说有多快。 
大多数政党支持的变化都可能被每年的调査所观察到，因为 
人们一般不在一年内多次改变支持的政党。然而，其他政治 
现象则更多变。例如，人们可能经常改变对现任总统做得如 
何的 看法; 关于总统的受欢迎程度，每年测量一次则可能低 
估了个人的总变化。 

就本书的目的而言，更重要的一点是，传统的固定样本 
设计不适用于估计人口总体的净变化。在传统的固定样本 
设计中，个人是在时间1被抽取并且跟踪，于是，在这种设计 
中，新的世代并没有随时间变化被加人样本。所以，我们不 
能估计人口总体的净变化。举例来说，我们不能使用传统的 
固定样本调査设计来判定在里根总统任期内，适龄投票人口 
中共和党人相对民主党人的比例是否增加了。 
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分析意 复调 査敝据 


可见，无论哪种研究设计都不是万能的。重复调查不适 
合估计个人的总变化，而传统的固定样本调査不适合估计变 
化的总趋势。为了克服这些局限性，调查方法论学者发展出 
包含固定样本设计和重复截面设计特征的调查设计。其 
中一种混合型的设计是“轮换固定样本调査 ” （Duncan &• 
Kalton , 1987)。在轮换固定样本调査中，固定样本是轮换 
的——新的固定样本被加人，旧的固定样本被去除——以保 
证最新的样本反映了正在变化的总体。人口现况调查和收 
人与项目参与调査 （ SIPP ) 就是轮换固定样本调查的例子。 
另一种混合型的设计被称为“分批固定样本调查 ” (Dimcan &• 
Kalton , 1987) ，它在重复调查中加人固定样本，以解决用重 
复调査估计总变化时的困难。英国社会态度调查就是分批 
固定样本调查的例子。全国选举研究也可部分地当做分批 
固定样本调査，因为它在其中几次调査中包含了固定样本 
(Kiecolt &- Nathan , 1985)。 

基什建议使用分批固定样本设计 （ K 1 S h , 1983、1986)。 
未来，分批固定样本设计和其他混合型设计可能会变得更普 
遍。然而，现有的调査数据通常不是重复截面数据（不包含 
固定样本)，就是固定样本调查数据。有两本著作讨论了固 
定样本调查数据 ( Finkel , 1995; Markus , 1979)。在本书中， 
我们的关注点是分析重复调查，包括有着重复调查成分的分 
批固定样本设计及其他设计。 



第 1 章导论 


第3节 | 重复调查的分析设计 


至少有三种基本的方法可用于分析重复调查。其中一 
种方法就是将各调査分开，分别进行分析。在这种方法下， 
分析重复调查与分析单个调查的方法是一样的，除了对多个 
调査重复同样的步骤。（除了在探索阶段对解释变量的作用 
是否随时间而变化进行初步分析）我想不出这么做的理由。 
如果研究目的是估计某个时点个体层次的关系，那么分析单 
独的调査就已足够。如果研究目的是分析一种关系是否改 
变，为了检验统计显著性，把调查“合并”起来而非单独分析 
它们则更容易(参看第6章)。即使变量的作用保持不变，把 
数据合并也更好，因为合并后可以对(不变的)作用 [1] 估计得 
更准确。简单来说，如果研究者关注的是社会变迁，我就看 
不到有什么理由把重复调査分开分析，因此在本书中，我不 
建议这种方法。 

第二种方法是用累积的截面数据来分析个人层次关系 
的大小和稳定性。举例来说，研究者可以用这种方法来分析 
阶级和政党身份的关系是否随时间保持稳定。在通常情况 
下，这种累积数据方法不需要花功夫进行数据组织，因为被 
大量使用的重复调查都可以以这种累积数据的格式购买，如 
美国综合社会调査和全国选举研究。累积调查方法很灵活， 
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分析 重复调 査数据 


只要研究者有检验个人层次或“微观”关系随时间变化的基 
础。第5章用一般的分解模型来呈现微观层面的变化如何 
导致总变化。第6章将描述和展示分析累积数据的简单模 
型，它们可用于检验微观层次的变化，也就是个人关系的 
变化。 

第三种方法是用累积数据来分析总变化。本书的一个 
特点是，它强调对宏观层次变化的分析。第3章描述和展现 
了估计总变化的方法。第4章描述了如何将变化趋势分解 
为世代的净变化导致的变化以及世代更替导致的变化(也就 
是人口更替的作用）。因为世代分析框架是我们讨论总变化 
趋势的基础，所以第2章回顾了世代分析，讲述了分解世代 
效应、年龄作用和时期作用的方法。 



第 4 节 I 关于术语 


因为诸如“分解”这类术语在各个学科中有不同的含义， 
在本书中，为避免混淆，我用方程对概念进行正式表述，用例 
子来说明方程。“合并数据”可以作为说明术语的含义可能 
不明确的好例子。在本章中，我多次提到集合或“合并”调 
查。虽然这个术语在关于调査的文献中被使用，但必须注 
意，我们所说的集合调査而成的合并数据不能与计量经济学 
家所说的合并时间序列数据/截面数据相混淆（参照 Sayrs ， 
1989) ，后者即固定样本数据。也就是说，在计量经济学的文 
献中，会提及使用“合并数据”中的单位层次的特点来控制个 
体长久存在的特征，这些特征影响我们关注的因变量，但又 
难以测量(例如，一个人的成功欲望，或者一个国家的地形， 
假如研究单位是国家）。显然，我们不能控制这些单位层次 
的特征，除非我们对给定的个体有多次测量，但我们不可能 
从合并的重复调查中得到它们。因此，“合并数据”有时指随 
时间跟踪相同的个人，有时指在不同时点得到的不同样本。 
为避免混淆，后文中我将用“累积数据”来指称集合起来的重 
复调査。 







区分年龄、时期及世代效应 
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分析霣复调 奎 数播 


为尝试区分世代、年龄和历史时期的影响，世代研究提 
供了一个帮助我们研究社会变迁的模板。在本书中，我倚重 
这个模板，尤其是在讨论总变化的时候(第3章和第4章）。 
因为之后将大量引用世代研究的基本概念，所以在本章我将 
简单地对这些概念进行回顾。我从定义世代效应以及它与 
年龄作用、时期作用的区别说起，然后介绍解决区分世代、年 
龄和时期作用这一难题的不同的实证方法。熟悉世代研究 
的读者可以直接参看关于如何分解年龄、时期和世代效应的 
讨论。 



第 2 牽区分年龄、时期及世代效应 


第1节 I 年龄、时期和世代效应 


社会科学家经常把世代研究作为他们研究变迁的起点。 
假设我们观察到一组成年人参与礼拜的比例有增长，且这组 
成年人自青少年起我们就一直跟踪研究，我们如何解释这种 
增长？研究世代的人会立刻从两种过程考虑这个问题。这 
个增长可能来自与历史时期相关的一般事件或过程，也许在 
所研究的时期里出现了宗教兴趣的复兴（时期作用）。另一 
种可能是，这种增长来自与人们年长化或生命周期有关的更 
具体的过程(年龄作用），随着年轻的成年人在一个社区中安 
顿下来、结婚、生育等等，他们更有可能参加礼拜，正如他们 
父母或祖父母经历过的那样。换句话说，我们研究的这个世 
代只是在重复以前几代人参加礼拜的生命轨迹。 

当然，参与礼拜的比例也可能随时间的增加反映了年龄 
和时期作用的共同影响。也许生命周期作用和复兴作用共 
同使该世代参与礼拜的比例提高了，或者生命周期的作用使 
参与礼拜的比例提高了，而世俗化(一种时期作用)使参与礼 
拜的比例降低了，因此我们观察到的提高反映了这两种互相 
抵消的作用的净作用(在此例中，生命周期的作用更强）。 

请考虑另一种情况,我们在某一时点观察到不同年龄段 
的人的差别，而不是世代随时间变得年长而发生的变化。例 
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如，我们发现20多岁的人比其他年龄段的人更不可能在总 
统选举中投票。世代研究者又会立刻想到两种不同的解释。 
第一种是年龄或者生命周期的解释:年轻人更难在一个社区 
中立足，他们更可能在上学，他们可能要照顾幼儿，诸如此 
类。如果年龄作用可以解释年轻人更少投票的行为，我们可 
以预期将来的世代会重复他们前辈随生命周期而变化的投 
票模式，即先是低投票率，到中年后该世代的投票率提高。 
另一种可能是，这个新的世代在他们的整个生命期都表现出 
低投票率•意味着这可能是世代效应，而不是年龄作用。在 
这种情况下，这一年轻世代的特别之处并不在于他们年轻， 
而是不同的世代在不同的时间出生。正如莱德所说，世代效 
应的出现是因为“任何世代的成员都只能参与生命的一小 
块，即他们在历史中占据的特殊位置” ( Ryder , 1965:844)。 

简而言之，“世代效应”指世代由于相同的经历或反应而 
造成的不同，“年龄作用”指与年龄相关的影响所造成的变 
化，而“时期作用”指与历史时期相关的影响所造成的不同。 
世代效应来自世代特殊的经历和社会化，也来自世代对相同 
的历史事件的反应(例如，转折性事件可能对年轻人有更深 
刻的影响，比如肯尼迪总统被刺杀或伊朗人质事件)。[ 2 ]年龄 
作用可能基于“内在的”发展或成熟化的变化，或者与年长化 
有关的生理变化，也可能基于与年龄相关的生命周期过程 
(婚姻状况、为人父母）。时期作用指历史背景的一致作用， 
也就是时间或者历史状况一致地影响了所有的世代（参见 
Glenn ， 1977； Hagenaars , 1990)。 



第 2 章区分年龄时期及世代效应 


第2节 I 识别上的难題 


研究者试图分解年龄、时期和世代效应时，总被以下方 
程所表现出的特性所 困扰： 

出生年份==测量 年份一 年龄 [2. 1] 


方程 2. 1说明，出生年份或者世代与测量年份及年龄是线性 
关系。因此，如果我们把所有的变量——世代（出生年份）、 
时期(测量年份)和年龄一都作为自变量放人回归模型，我 
们就不能估计这个模型。也就是说，我们不能估计以下 
模型： 


Em 二氏十阼父时期+知乂年龄+氏父世代 

[ 2 . 2 ] 

此处， f ：( y ) 是 y 的估计值，时期是测量年份，年龄以年为单 
位，世代是出生年份(在此以及下文中，我用希腊字母来表示 
总体参数，所以 (3 表示总体参数，而不是标准化的斜率）。 

为了更好地理解为什么这里有估计上的问题，请考虑我 
们如何解释方程 2 . 2中的氏。 |3 c 是控制了测量年份和年龄 
后，出生年份增长导致的 Y 的估计值的变化。然而，如果年 
龄和测量年份都被控制了，出生年份就不能变化，因为出生 
年份=测量年份_年龄。与之类似，时期的斜率 |3 P 在控制了 
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年龄和世代后也不能被估计，年龄的斜率 Pa 在控制了时期 
和世代后也不能被估计。这就是世代研究中的识别难题。 

早先曾流传着两种看似有效然而错误的方法。用 Y 对 
所有组合进行回归一年龄与时期、年龄与世代、时期与世 
代——并没有什么意义。因为年龄与时期包含的信息跟年 
龄与世代或时期与世代所包含的信息一样,我们从各模型得 
到的决定系数0? 2 ) 也相同，因此在这里，我们不能用“最佳拟 
合”作为决定最合适模型的标准。截面数据分析也不能剔除 
时期作用的可能性。运用截面数据分析，相当于我们用一个 
常数々代替了方程 2.1 中的测量年份，导致世代=々_年龄。 
所以，我们仍然不能从年龄作用中区分出世代效应。因此， 
区分世代效应和年龄作用的难题不能通过运用截面数据分 
析来解决。 



第 2 章区分年齡、时期及世代效应 


17 


第3节 | 克服识别难题的策略 


我们没有绝对可靠的分解年龄、时期和世代效应的技术 
手段 (Wdmonth， 1990)。然而,我们有解决识别难题的可行 
策略。为了更具说服力，世代研究中经常使用以下的一种或 
多种策略 (Firebaugh Chen, 1995)。 


事先控制系数 


一种常用的策略是进行假定以帮助识别。这种策略的 
其中一种形式是，研究者假定这些作用中的一种一年龄、 
时期或世代——是0,或至少小到可以被忽略。举例来说，如 
果我们假定年龄作用可以被忽略，那么我们就假定在方 
程 2.2 中， |3 A = 0,然后只要用 y 对时期和世代进行回归 
即可。 

这个策略的问题在于，它的结果只有在用于识别的假定 
知= 0成立的情况下才可靠。如果这个假定是错误的，那么 
我们对时期作用和世代效应的估计会被年龄作用所影响。把 
年龄= 时期一 世代代人方程 2. 2，我们会很容易 发现： 

E(Y)=ft+ft.X 时期 + p A X年龄+氏X世代(无法估计） 

= ft +泠X时期+ (3 A X ( 时期 一世代 ) + |3fc X世代 [2. 3] 
=氏+ (氏+ (3 A ) X时期+ (氏_ p A ) X世代 
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换言之，如果我们用 y 对时期和世代进行回归，得到估计值 
并不是一个问题。实际上，我们会得到对应于时期项和世代 
项的系数。问题在于，如何解释这两个系数。正如方程 2. 3 
所展示的，时期项的系数是时期作用与年龄作用的和（办+ 
p A ) ，而世代项的系数是时期作用与年龄作用的差(恥 一 以）。 
因此，方程 2. 3中的斜率只有在年龄作用实际是0的时候， 
才能得到时期和世代效应的无偏估计，否则，时期项的系数 
所反映的既包含年龄作用也包含时期作用，世代项的系数所 
反映的既包含年龄作用也包含世代效应。 

我们也可以采用其他用于识别的假定。比如梅森、梅 
森、温斯伯勒和普尔等人展示了年龄、时期和世代效应在分 
类数据分析里可以通过限定邻近的世代（或年龄、或时期） 
的作用相同来估计 ( Mason 、 Mason、Wmsborough &- Poole , 
1973)。 

虽然一般来说，假定相邻类别的作用一致比简单地假定 
其中一种作用为0更审慎，但即使是相邻类别的作用一致的 
假定也有可能是错误的，这也会导致不可靠的结果 ( Glenn ， 
1976)。此外，由于年龄、时期和世代项之间的高度共线性， 
我们需要大样本来获得可靠的估计。我们可以通过限制邻 
近类别有相同的作用来获得估计值，因为此时时期、世代和 
年龄不再具有完全共线性。虽然它们不再具有完全共线性， 
但是三个变量之间不免还是有高度共线性(在控制了第三个 
变量的情况下，任何两个变量之间的相关系数将接近于 
1.0)。因此，在小样本中，时期、世代和年龄作用的估计值往 
往不稳定。 
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使用辅助信息 


当提到年龄一时期一世代识别难题的时候，我们指的是 
观测到的结果的模式在数学上可能被年龄、时期和世代效应 
中多于一种的组合所解释。然而，数学上的多种可能性，其 
出现机会在现实中并不完全相等。我们所观测到的结果有 
几种不同的解释，“辅助信息”帮助我们判断其中哪种解释的 
可能性相对更大 ( Glenn , 1977)。如果在三个预测变量（年 
龄、时期和世代)中的一个或更多变量之间存在非线性关系， 
它就给了我们这样的机会，因为通常对特定的一种非线性模 
式只有一种可能的解释(例如，工资与年龄之间的倒 U 形关 
系几乎肯定是年龄而不是世代对工资的作用）。 

请看方程 2. 4,其中进入回归的是年龄和 时期： 

E ( Y )= ft +(3 A X 年龄+氏 X 世代+氏 X 时期(无法估计） 

=择+^父年龄+氏父（时期一年龄)+氐/时期 [2.4] 
=阵+(^—氏）><年龄+(氏+氏）><_ 


假设 y =每年的礼拜参与(成年人每年参加礼拜的次数)，假 
定我们用参与对时期和年龄进行回归后得到， E (参与 ） = 
5 +0.5( 年龄)。年龄的系数是正的，意味着年长的成年人更 
可能参加礼拜。时期的系数为0,显示各年龄人士参加礼拜 
随时间没有发生变化，即在给定的年龄，各相继的世代参加 
礼拜的比例是相同的。这个模式显示的是参加礼拜的次数 
会随着生命周期而增加，相继的世代会重复前辈参加礼拜的 
规律。数学上来说，这个模式可能来自几种年龄、时期和世 
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代效应的组合。例如 ，氏 =— o . 5且扣= o . 5 (负的世代效应 
完全被正的时期作用抵消，所以 p P + Pc = 0)，且年龄没有作 
用 ( p A =0)，因此卩 A _pc = 0.5。然而，这样的组合很牵强。 
更可能的情况是，这种各世代参加礼拜的一致轨迹反映的是 
纯粹的年龄作用，即 Pa = 0. 5 (Firebaugh &• Harley , 1991) „ 
无论如何，重点是某些数学上的可能性比另一些更大，这个 
事实使我们分解年龄、时期和世代三者的作用成为可能 
( Glenn , 1976、 1977)。 

使用直接的测量 


如果我们假定世代之间的差别来自各世代之间的相对 
大小，我们通常会使用直接测量的策略 （ Easterlm ， 1980)。 
在这种情况下，世代(其大小）的明显特点很容易测量。在更 
多情况下，它的明显特点不那么清楚，且很难测量。请考虑 
莱德所讨论的世代效应，即“社会变迁”对年轻人的影响更大 
( Ryder , 1965:861)。尽管我们都认为，年轻人实际上更具激 
情 ( Glenn ， 1980； Mannheim , 1 9 27/1952)，但鉴别和测量导 
致持续的世代差异的社会变迁是一项极为困难的工作。同 
样，在通常情况下，测量导致时期作用的社会变迁及导致年 
龄作用的、与年龄相关的影响，都是困难的工作。这种困难， 
部分是由于我们很难证明自己的测量是无遗漏的。举例来 
说，如果我们用关键的生命周期状况(婚姻状况、为人父母、 
工作状况等等)来测量年龄作用，总会有批评说，这些状况只 
是抓住了所谓“年龄作用”中一小部分基于年龄的影响。 

简言之，我们没有“巧妙的方法”来区分年龄、时期和世 
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代效应，但是有一些策略可用于解决识别难题。瞄 
同特点是需要仔细地将年龄、时期和世代效应的__ 
化。在“辅助信息”和直接测量策略中，理论的重要性显_ 
见。理论在“使用技术控制”的策略中同样重要，这种策略在 
模型中事先加人识别的约束条件。这些用于识别的约束条 
件必须基于审慎的理论，因为不正确的假定会导致不可靠的 
结果。如果有其他可能的识别假定，我们应该在不同的识别 
假定下，仔细比较年龄、时期和世代效应的估计值，以检査结 
果对不同的识别假定的敏感度。 
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分析重 ft 调 査数据 


许多重复调查数据的搜集持续了几十年，可以用于发现 
社会趋势。其要点是把趋势和偶然的变动区分开来。 
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我们把 Y 从时间1到时间2的变化定义为 Y 2 — K 。对 
重复调査的分析有时会过多地解释这个差别，尤其是时间间 
隔较短的时候。从一项调査到另一项调查之间观察到的差 
异，有时被用于声称社会向一个或另一个方向变化的根据。 
人们应该小心此类解释。由于存在抽样误差和偶然的短期 
变动，仅靠两个时间点上的测量、凭直觉来推论社会趋势是 
轻率的。 

许多重复调查已经累计搜集了 10年每年或每两年一次 
的调査数据，这些调查为关于社会趋势的结论提供了更为坚 
实的基础。一项基本的分析原则是，对社会趋势的分析，数 
据多总比数据少好。通常我们不会仅仅分析头尾两个时间 
之间的差别,我们希望使用所有的调查。问题是，如何使调 
査数据之间的变动平滑，以判断是否存在潜在的趋势？ 

其中一种方法是使用移动平均值。我们设总的时间序 
列为 I , y 2 ，…， Y T ， 其中 Y 是年份1，2,…， T 的平均值。 
Y 在时间 f 的移动平均值由邻近 Y , 且包括 Y t 的 Y 的加权平 
均值所决定。例如，有一个五年的移动平均值， y 在时间《的 
移动平均值是 2 , y ^， 兄， y t +1 ， 1 +2 >的加权平均值， 
其中权重可以依次为{1/9, 2/9, 3/9, 2/9, 1/9} ( Kendall , 
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1973:35)。加权平均值是有用的第一步，即便仅仅为了做一 
个平滑了的抽样波动图。平滑曲线图可以帮助判断 y 是否 
在给定的时间间隔内改变了变化方向。在这种情况下，用线 
性趋势来估计数据就会误入歧途。 

如果用线性趋势来估计数据是合适的，我们就可以用回 
归来确定样本的趋势在统计上是不是显著。假设我们有下 
次重复的年度调查，合适的一步是把回归到调查年 份上： 

£( Y „) = (3„+氏 X 年,， [3.1] 

其中 ，I = \ , 2 , •••, I ,； t = 1, 2, •••, T [3. 2] 

E ( Y ) 是 Y 的期望值， Y it 表示第 z 个人在第《次调查中的 Y 
值，表示第 f 次调査的样本量。此处， Ed ) 是条件均值 
(以年份的函数来表示的 Y 的期望值或均值）。一个非零的 
降意味着 Y 是年份的线性函数。斜率的符号表示 Y 的趋势 
是向上或向下的。在估计方程 3. 1的时候，将时间《为1时 
的年份(第一次调查的年份)作为0会很方便，由此 po 就是研 
究首年 Y 均值的预测值。 

很多调查常常以较高的抽样概率抽取某些群体。在有 
些情况下，以较高概率抽样是有意为之的（保证样本中包含 
足够的少数群体成员）。在其他情况下，以较高概率抽样是 
抽样设计的副产品。例如，抽取户并且只访问户内的一个 
人，有些调査会以较高概率抽取独居的成年人。在这些情况 
下，可以通过加权来将之恢复为正确的人口百分比 ( Stephen - 
son , 1978)。样本加权的基本原则是用被抽中概率的倒数来 
加权 （ Kalton , 1983)。假设我们的目标人口中有两个群 
体—— M (多数群体)和 m (少数群体），分别构成人口的90% 
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和10%。为了保证样本中有足够的少数群体成员，我们设定 
样本的构成为 0.20 的 W 和 0.80 的 M 。 为恢复正确的人口 
百分比，我们给 m 的成员加权 0. 10/0. 20 = 0.5, 并且给 M 
的成员加权 0. 90/0. 80 = 1. 125。[ 3 ] 

最后需要强调的是，使用方程 3. 1来检测趋势是假定了 
比较的对象在各调査中的测量是一致的 ( Smith ， 1993)。“机 
构影响” ( Johnston , 1981) 构成了对这种一致性的威胁，所以 
对研究趋势来说，数据最好来自同一个调查机构。在不可能 
做到的情况下，有时候可以通过把两个调査机构的数据衔接 
起来以构成关于历史趋势的数据，只要这些调查在不同时点 
询问了同样的问题。这种衔接假定，两个历史序列数据在时 
间上是重叠的。如果这些序列数据只是连接（即没有重叠） 
而不是衔接，那么在两个序列数据的接点上即使有变化，也 
很难判断是真正的变化,还是由于数据来自不同的调查机构 
的影响。 

即便数据来自同一个调查公司，也不能保证万无一失。 
有经验的调查研究者知道，有时候对调査问题措词的改变， 
即使看似无害，也可能导致回答上的显著差别 （ Rasinski ， 
1988； Smith , 1987)。此外，对调查中一个特定问题的回答， 
可能受到调査中其他问题的性质的影响，因此即使问题 Q 在 
各调查中保持一致，由于“上下文影响”，调查中其他问题的 
变化也可能导致对问题 Q 回答的变化 ( Smith , 1988、1991)。 
即使措词和上下文在各调查中是一致的，关键词(例如“保守 
的”和“自由的”）的含义仍有可能随时间发生变化。在判断 
为什么在重复调查中出现了某种趋势时，人们首先应该问， 
这个趋势是不是仅仅反映了受访者理解调查问题的变化。 
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第2节 I 趋势中的组别 差异: 
趋同还是趋异？ 


整体趋势的方向可能掩盖了社会中主要群体的趋势。 
举例来说，调查显示，过去几十年中，反对黑人与白人通婚 
的比例下降了 （Firebaugh & Davis , 1988； Gallup &- New ¬ 
port , 1991)。 这个整体趋势可能掩盖了区域的或群体的差 
异。这种下降在南部地区是更快还是更慢？在男性和女 
性、黑人和白人中，这种反对比例的下降速度一样吗？这个 
趋势在白人女性和黑人女性中是不是出现了交叉，导致现 
在黑人女性比白人女性更有可能反对种族通婚 （Paset 
Taylor , 1991)? 

在线性趋势的组别差异中，有以下几种可能的情 况:一 
致趋势、平行趋势、趋同趋势、趋异趋势、交叉趋势。假设我 
们分别对南方人 （ S ) 和北方人 （ iV ) 估计白人对种族通婚的 
反对趋势。各自的估计可以通过分别进行回归 得到： 

fXYf ) =庠 +闽 X 年，， [3.3] 

£0^)=拟 + 陟乂年„ [3.4] 

其中 Y 是反对种族通婚的比例，如前所述 w 表示个人，< 表示 
调查。方程 3. 3估计的是南方人的线性趋势，方程 3. 4产生 
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的是非南方人的线性趋势。如果我们设定第一次调査为年 
= 0,那么两个方程的截距 [4] 分别为研究开始时南方人和北 
方人反对种族通婚的比例。为了简化注释，在此我假定测量 
间距为年，实际上测量间距可以是季度、月或者其他间距。 
在那些情况下，我们会相应地更改自变量，例如把方程 3. 3 
和方程 3. 4中的年„改为季,，或月,,。 

与分别估计对应于南方人和北方人的两个回归方程相 
比，通常更简便的方法是把两个方程合并为一个方程。方程 
3.3 和方程 3. 4可以通过一个虚拟变量和一个交互项来 
合并： 


E ( Y „) =印 + pr X 年,,+ SoS „ + S , (S X 年), ，[3. 5] 

在这里， S 是一个虚拟变量，如果受访者是南方人则取值为 
1。这种单独方程的方法提供的重要优点是，因为方程 3. 5 
中的 S 。 和 S , 分别表示截距和斜率的差别，所以我们可以立 
刻判别出南方人和非南方人有没有开始状态的差异 （ S 。） 和 
趋势上的差异(&)。 

如果 S 。 和8,同时为0,那么南方人和非南方人的趋势是 
相同的(一样的截距和斜率)。如果 S 。 不是0而祝是0,那么 
他们的趋势是平行的。如果都不为0且同号，那么 
他们的趋势是趋异的。如果 S 。 和 S , 都不为0且异号，那么 
他们的趋势是趋同的（或者他们交叉了，这取决于南方人和 
北方人初始的差别以及趋同的速度）。 

前述原则很容易推导出来。在方程 3. 5中代人0得到 
非南方人的估计，我 们有： 


E(Y, t ) = po* + pr X 年 lt 


[3. 6] 
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很清楚，这时印=砣（截距是非南方人的截距），且 
pr =甿（斜率是非南方人的斜率)。给方程 3.5 代入1得到 
南方人的估计，我们 得到： 

£ XY „) = ( 抝+ 父年„ [3.7] 

因为抝= pc •，且妒= pr ，因此，南方人的截距(皞）和斜率 
(( Bf ) 分别是咬+ S 。 和叱十 Si 。所以， 

do H [3.8] 

并且 

S , = pf-pr [3.9] 

如果南方人的截距和斜率 S 都不为0且为正，那么南方人 
在初始时间下对种族通婚的反对更大些 （ S 。 > 0 — 度> 
抝），且珀 >甿，所以区域差异在增加。如果8都为负，那 
么非南方人初始时间下的反对更大些 （ S 。 < 0)，且因为 
甿>贫，所以区域差异在增加。简言之， S 有同样符号的 
时候趋势是趋异的， S 有不同符号的时候则会出现趋同的 
趋势。 

这些原则对“效应编码”同样适用，也就是说，在方程 3. 5 
中， S 对南方编码为1，对非南方则编 码为一 1 (在虚拟编码情 
况下， pr 是参照组的趋势;在效应编码情况下， pr 是南方人 
和非南方人趋势的均值）。把+ 1和一 1分别代入方程 3. 5 
的南方人和北方人中，得到 P ? = Po + So » ^ = |3, + S ,, |3^ = 
Po — S 。 和故 = Pi — Si 。 因此， 


且 


So =(苈一於 )/2 


[3.10] 
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S , = ( J 3 f - pr )/2( 在效应编码的情况下） [3.11] 


关于自选择的注意事项 


在某些情况下，成为某个群体成员的原因与我们感兴 
趣的变量相关，这也会造成群体间趋异的出现。举例来说， 
假设我们根据加人的教会类型把基督教徒分成“保守的”和 
“自由的”，然后我们发现这两组人在公立学校的祷告问题 
上越来越两极化。在没有固定样本数据的情况下，我们难 
以解释这种两极化，是因为保守的基督教徒变得比自由的 
基督教徒更支持祷告吗？或者因果关系的方向是相反的， 
即对于祷告的态度影响了人们加人哪个教会？换言之，当 
公立学校的祷告问题变成一项更引人关注的公共事件时， 
也许它也变成了选择教会的一项重要标准，且这可以解释 
我们观察到的两极化，因为如果自由教会中的成员支持在 
公立学校中祷告，就可能转而加入保守教会，而如果保守教 
会中的成员反对在公立学校中祷告，就可能转而加人自由 
教会。 

这个问题的一种变形，可以从南方人和非南方人在反对 
黑人歧视方面的差异缩小的发现中看到 （Firebaugh 8*. 
Davis , 1988)。由于存在人口迁移，区域差异的缩小可能是 
“虚假的”，因为迁移提高了来自非南方地区的南方人的比 
例。为了排除这个可能，菲尔鲍和戴维斯在包含移民和不包 
含移民的情况下研究了区域趋势（并且得到了相似的结果） 
(Firebaugh &- Davis , 1988)。 

此处我们要强调的是，在使用重复调查数据来检验趋同 
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和趋异趋势的时候，要注意自选择和迁移问题。这个问题在 
个人能够选择加人或离开某个群体——宗教群体、政党、地 
域等等(但不包括先赋的群体，如年龄群或性别)——的时候 
就容易出现，因为加人和离开这些群体的因素可能与因变量 
相关。 
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第3节 I 趋异模型的实证 案例： 
检验年龄两极化的假设 


在当前美国.我们关注退休人员和劳动者之间的断裂。 
记者们猜测，两个群体间相对幸福程度的改变与长者福利成 
本的提高，共同造成了年轻人与长者间的潜在冲突，这体现 
在社会福利、医疗卫生、教育以及其他在利益上可能趋异的 
领域中。例如，作为多家报社专栏作家的理査德 • 里夫斯 
Orchard Reeves ) 瞥 告说: “美国出现了长者的要求与全社会 
的需要之间的对立 ■/’(Rosenbaum Button , 1992: 385) 朗曼 
声称 :“婴 儿潮时期出生的人正在用他们收人中前所未有的 
部分来贍养现在已经退休的年长的一代人。”他也警 告说: 
“很可能的结果是发生一场年轻人与长者的战争，除非许多 
根本性的趋势发生了迅速转变。” （ Longman ，1987:2) 相反， 
老年学家一般认为 :“老 年人和年轻人在大多数事情上没有 
什么区别。” ( Day , 1990：47) 

虽然发生一场代际观念上的剧烈冲突是牵强的，但在美 
国，与年龄相关的区别也许正在深化。单公式的交互模型 
(方程 3. 5) 在此情况下适用。如果这种区别在深化，我们预 
期会得到相同符号的8,这意味着趋异的趋势。 

我选择两个因变量来检验年龄两极化的假 设:对 教育支 
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出的支持和对社会福利支出的支持。它们是从美国综合社 
会调查的一系列问题中选出来的，其介绍如下： 

我们的国家面对很多问题，它们中没有一个可以很 
容易或花费很少的钱而 解决。 我会提及其中的一些问 
题，希望你告诉我，你认为我们是否在解决它们的时候 
花费了大多、太少或适量的钱？我们是否花费了太多、 
太少或适量的钱……在提高国家的教育系统和社会福 
利上？ 

对教育(支出）的支持最早于1973年加入问卷，对社会 
福利(支出）的支持于1984年加人问卷。我选择教育是因为 
在一项截面研究中 (1988 年全国选举研究），文诺夫斯基发现 
了“颇强”的年龄差别，其中长者对教育支出的支持度最低 
( Vinovskis , 1993:62)。我选择社会福利是因为它在代际平 
等的文献中的中心地位 （ Donza 、 Duncan、Corcoran &- Gros - 
kind , 1988； Kothkoff , 1992)。 对这两个因变量，我对其回答 
进行了两种区分一太多对适量或太少以及太少对适量或 

太多-并使用 logistic 回归。 

表 3.1 和表 3. 2汇报了结果。退休人员确实显著地更 
不可能支持教育支出(表 3. 1中的 S 。）， 他们更可能说我们在 
上面花费了太多，而更不可能说我们花费得 太少。 然而，与 
年龄两极化假设不符的是，这个差别(在）在过去20多年中并 
没有变得更明显。在任何一种编码方法下，初始状态的差别 
和趋势的差别都有不同的符号，这都反映了趋同而不是趋 
异。无论如何，尽管样本相对较大，反映趋势差别的系数 
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(^)都没有达到统计显著性。我们认为，退休人员和劳动者 
的趋势是平行的。总的来说，退休人员更不支持教育支出， 
但是没有证据表明长者和年轻人在该问题上的区别越来 
越大。 

表 3. 1 对教育支出的支持的趋势分析 (1973 —1993 年: logic 系数） 


因变量的编码 a 


模 型 

1 =支出 
太多 

1 =支出 
太少 

模型1:退休人员对其他人 b (N= 19012) ^ 

初始差 别:退 休人员减其他人。(方程3.5中的$ 0 ) 

0.978** 

-0. 583** 

退休人员的趋势 i) 

-0. 075 ## 

0.050** 

趋势的差别 :退休 人员减其他人 d (f d 

—0.019 

0.001 

模型2:退休人员对有薪水的劳动者 b (N = 13992) 
初始差 别:退 休人员减劳动者* 1 

0. 947** 

-0.643 料 

退休人员的趋势 

-0. 075** 

—0 050** 

趋势的差别:退休人员减劳动者 d 

-0.013 

0.002 


注 A 在第一栏的系数中，“适量”与“花费太少”归为一类，在第二栏中，它与 
“花费太多”归为一类。第一栏：1 =花费太多，0 =适量或花费 太少； 
第二栏：1 =花费太少，0 =适度或花费太多。 
b. “其他人”包括处理家务者和学生，“有薪水的劳动者”不包括前述 
群体。 

a 截距的差别，其中第一年(此处是1973年)编码为0。 
d. 趋势的差别(年的斜^)。 

•表示 PC0.05; ** 表示 p< 0.001。 

资料来源 :美国 综合社会调查 (Davis & Smith, 1994) ,不包含以较高概率抽 
取的黑人样本。 

对于社会福利支出的情况（表 3. 2)，结论取决于变量如 
何区分。与代际冲突的文献相一致，退休人员不可能说我们 
在社会福利上支出太多，但是他们也更不可能说我们在社会 
福利上花费太少。退休人员显著地更可能回答，在社会福利 
上的花费是“适量的”，而其他人更可能选择“太多”或“太 
少”。对于劳动者或退休人员谁更可能支持社会福利开支这 
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个问题，取决于我们研究的是分布的哪一端。 


表 3. 2对社会福利支出的支持的趋势分析 {1984-1993 年 :logic 系数> 


因变量的编码 a 


模 型 

1 =支出 
太多 

1 =支出 
太少 

模型1:退休人员对其他人 12262) 

初始差 别:退 休人员减其他人^ 

-0. 879 - 

-0. 481 M 

退休人员的趋势 

0. 042 

-0.008 

趋势的差别 :退休 人员减其他人 d " 

0.078 

0.022 

模型2:退休人员对有薪水的劳动者 b (N = 9666) 

初始差别 :退休 人员减劳动者 e 

-1.029^ 

-0. 489** 

退休人员的趋势 

0. 042 

-0. 008 

趋势的差别:退休人员减劳动者 d 

0. 080 

0.029 


注以 在第一栏的系数中，“适量”与“花费太少”归为一类，在第二栏中，它与 
“花费太多”归为一类。第一栏：1 =花费太多，0 =适量或花费 太少; 
第二栏 ： 1 = 花费太少，0 = 适度或花费太多。 

b . “其他人”包括处理家务者和学生，“有薪水的劳动者”不包括前述 
群体。 

c . 截距的差别，其中第一年(此处是1984年)编码为0。 
a. 趋势的差别(年的斜率)。 

* 表示/ ><0.05; -表示 A <0.001。 

资料来源 :美国 综合社会调査，不包含以较高概率抽取的黑人样本。 

同样，没有证据显示有趋异的趋势，至少对有数据的这 


10年 (1984— 1994年)来说是这样。交互项在没有达到统计 
显著性。尽管退休人员和劳动者之间存在差别，但这种差别 
在过去10多年中保持了稳定。 

除了检验年龄两极化假设，趋同/趋异模型对当代社会 
问题还有其他明显的应用。例如，最近我们听到“男女差别” 
在支持共和党、环保态度、机会均等行动的态度等方面的表 
现。男女之间在态度和行为上是否有差别？如果有，近几十 
年来有没有扩大？ 
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福克斯和菲尔鲍使用趋势趋同/趋异模型和综合社会调 
査来回答男性和女性对科学的信心上的差别 （Fox & Fire - 
baugh , 1992)。他们发现了趋异的趋势 :女性 比男性对科学 
更没有信心，且这种差别在过去几十年中扩大了。用以上的 
方程来说，初始差异的系数 S 。 和趋势差异的系数&有相同 
的符号，且在研究中都达到了统计显著性。因此，他们的研 
究指出了性别两极化的可能性，至少在美国人对科学的信心 
方面来说是如此。 





分解总趋势 
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如果我们发现，在选民中民主党人和共和党人的相对比 
例发生了变化，我们就可以推论，要么是个人改变了政党支 
持，要么是选民的总体发生了变化(假定是因为年长的世代 
去世，并且被年轻的世代所代替），或者两者都有。换言之， 
总趋势的可能的来源是个人和总体的改变所造成的净变化。 
作为研究社会变迁的第一步，从成员身份的变化中区分出个 
人改变造成的变化通常是有意义的。在本章中，我会描述和 
演示两种“近似分解”方法，也就是把一个趋势分解为它们可 
能的来源。我会以介绍在什么情况下，社会变迁的速度会快 
于社会中一般成年人的变化来总结本章。 
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第1节 I 世代内的变化对总变化 

» __r ■.關 嗄 酬霸棚 iwww wwffMaiiTraTOiBwrifW ii y mfffwm 


重复调査可用于研究社会变迁。例如，白人受访者对反 
对黑人和白人通婚的法律的支持从1974年美国综合社会调 
査显示的35%下降到1994年美国综合社会调査的16%。为 
了研究产生这种变化的可能的原因，追踪世代内的百分比变 
化是有用的。如果世代内的变化与总变化保持一致，我们就 
可以推论说，总变化从个人变化的净效应而来。相反，如果 
在世代内反对种族通婚的比例没有随时间而改变，我们可以 
推论说，总变化来自人口更替的变化，而不是个人变化的净 
效应。更常见的情况是，总变化来自上述两种变化，此时的 
重点是判别它们各自的相对贡献。 

表 4.1 展示了把数据排列起来以比较世代内的变化与 
总变化的有用方法。行表示世代，因此从左向右阅读每行， 
我们可以发现，每个世代内白人对反对种族通婚的法律的支 
持率变化。世代内的变化可以与总百分比的变化相 比较： 
1974年到1984年的变化是_7. 3%，1984年到1994年的变 
化是一 11.4%(表4.1)。 

表 4.1 中的总百分比是世代百分比的加权平均值。例 
如，1974年， 34. 6%的受访者对反对种族通婚的法律表示支 
持。这个百分比是第一列内的世代百分比的加权平 均值: 
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[15.0 X (307/1243)] + [24. 3 X (235/1243)] + [32. 8 X 
(201/1243)] + [45. 2 X (217/1243)] + [50. 3 X (159/1243)] 
+ [71. 4 X (98/1243)] + [61. 5 X (26/1243)] = 34. 6 (在四舍 
五人误差下）。因为总百分比是世代百分比的加权平均值， 
所以总百分比的变化是由世代百分比的变化或者世代的相 
对大小(权重)的变化而来，或者两者均有。简言之，社会变 
迁可以看做世代内的变化和世代相对大小的变化的函数。 

需要强调的是，表 4. 1的编排有特殊的意义。之所以这 
样，是因为列均值的改变(包括百分比，因为百分比是取值为 
0到100的二分变量的均值)总是可以表达为行内均值变化 
的加权平均值。因为这总是成立，那么表 4. 1的编排有什么 
特别？表 4. 1的编排有重要意义，因为通过选择世代为行变 
量，它区分了基于个人的和基于总体改变的社会变迁。因为 
个人内嵌于世代中，所以行以内的改变是个人的改变。当 
然，我们不知道行与行之间的变化来自年龄作用还是时期作 
用(对照前述的方程 2. 3; Firebaugh , 1990; Rodgers , 1990)， 
但这并不是此处关注的问题。问题是，社会变迁中有多少来 
自观念的改变，有多少来自年长的成年人被更替为年轻的成 
年人？詹姆斯 • 戴维斯这 么说： 

毫无疑问，在同一行中，我们讨论的是同一（群） 

人 . 在每一列中，我们讨论的是不同的总体。由此， 

这个编排确实把变迁区分为“改变”（在特定行中的人改 
变他们的观点）和“更替”（列变量的构成的变化）。 
(James Davis , 1992:274) 
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诺尔波特 ( Norpoth ，1987) 认识到世代一时期的数据排列 
的重要意义，他用这种数据排列回答了本章开头所提出的改 
变政党倾向的问题。在他的表 4( Norpoth ，1987:386) 中，诺尔 
波特运用世代一时期排列，主张由于世代更替，转向共和党的 
政党倾向改变“正在发生并且持续进行着”。用他的话来说， 
“自1980年来，年轻人中共和党支持者的历史性增长……预 
示了通过代际更替发生的政党倾向改变” ( Norpoth , 1987： 
376)。然而诺尔波特由此止步，实际上，他没有把共和党人变 
化的百分比分解为世代更替和观念改变两部分。在这方面， 
诺尔波特的研究并不特别。虽然社会科学家经常提到世代或 
代际更替的影响，但他们很少去估计这种影响的大小，原因可 
能是，他们中知道怎么估计代际更替作用的人不多。 

在本章余下的部分，我会介绍两种方法-种基于回 

归，另一种基于代数——来把社会变迁分解为世代更替和世 
代内的改变两部分。对种族通婚的态度改变是一个方便的起 
点。通过把数据排列成表 4. 1的形式，我们可以立刻看到对 
种族通婚的反对从1974年到1984年之间的下降只来自总体 
改变; 相反，从1984年到1994年，这些改变大多来自态度改变 
(下文详述)。从1974年到1984年，世代内改变的平均值接近 
0。一些世代的均值改变为正，一些为负，但这些改变都没有 
达到统计显著性，因此， 7. 3%的总下降来自总体的改变，即年 
长的、更带偏见的世代被年轻的、较少偏见的世代所代替。 

菲尔鲍和戴维斯研究了 1972年至1984年间人们对种 
族通婚态度的改变，得出了一样的结论 (Firebaugh &• Davis , 
1988)。他们不是把数据编排成表 4. 1的形式，而是用回归 
来分解总趋势。下一节将介绍他们使用的方法。 
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在本节中，我将介绍“线性分解” ( Firebaugh ，1989) 的方 
法。线性分解假定，世代内的改变都是线性且叠加的。在下 
一节中，我还将介绍一种代数分解方法，它用于线性 一叠加 
的假设不恰当的情况下。按照以往的经验，线性分解通常比 
代数分解更容易，但这两种方法在变化是单调的情况下，所 
得出的结论是相似的。 

线性分解和代数分解都把总的社会变迁分解为源于世 
代更替的部分和个人改变的部分。虽然线性回归运用了世 
代一时期的设计，但它并不像表 4. 1那样从把某些相邻出生 
年的人合并成一组开始，因为线性分解把世代看做连续的 
(出生年)。线性分解的第一步不是标准的世代表，而是线性 
和叠加的回归模型。 

因为世代表(例如表 4. 1) 是世代分析的常规方法，所以 
我们选择何处作为起点来分解变迁很重要。在标准的世代 
表中，行和列的类别有相同的宽度（例如，都以10年为间 
隔），所以可以在表的对角线上跟踪同龄群或世代(在世代一 
时期设计中，同龄群在表的对角线上移动）。因为年龄要根 
据列的间隔来合并成群,所以信息便浪费了。然而，把年龄 
按对角线排列来分解变迁是不必要的。分解的目的是区分 
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由个人改变而导致的变化和由世代构成改变而导致的变化。 
为了做到这点，我们只需要把数据排列成我们能够随时间跟 
踪世代的形式。为了随时间跟踪世代，我们可以采用一种简 
单的数据排列，以出生年为行变量，时期（测量年份)为列变 
量。因此，对于社会变迁的分解，我们没有必要把出生年合 
并为几个大类，如“大萧条世代”“第二次世界大战世代”，等 
等。如果研究者决定合并成群,以理论来指导合并可以避免 
世代在表中与列的时间间隔相匹配的苛刻要求。 


进行线性分解 

线性分解包括两步。第一步是用回归来估计世代内 Y 
的年变化。因为我们假定世代内的斜率是线性的和平行的 
(叠加的），所以我们可以用以下的回归方程来估计世代内的 
年 变化： 


zk + b , X 年, t + b 2 X 世代, t + e, t [4.1] 

其中， Y , t 是在第 f 次调查中第 * 个受访者的 Y 值， b 。 是估计的 
截距， b , 是估计的世代内的斜率， b 2 是估计的世代间的斜率， 
年, t 是第 i 次调査中第 z 个受访者的调查年，世代,，是第 i 次调 
查中第 * 个受访者的出生年。请注意，累积数据被用于估计 
方程 4. 1。因为世代在方程中，所以 b , 估计的是控制了世代 
内的斜率之后的世代变化。世代的系数 h 是世代间的斜 
率，即相邻世代间的平均差别。 [5] 线性分解假定世代间和世 
代内的斜率是线性的。 

线性分解的第二步是用方程 4. 1中的斜率来估计世代 
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内的改变和世代更替对总的社会变迁的 贡献。 因为 h 估计 
每个时间单位(这里为年)里世代内的改变，为了估计世代内 
改变对社会变迁的总贡献，我们把 ba 乘以从第一个调査到 
最后一个调査的间隔年数(或季数、月数，取决于时间单 位）： 

估计的世代内变化的贡献= b ! ( YRt - YR ,) [4.2] 


其中， W ? T 是最后一次调查的年份，是第一次调査的年 
份。同样，为估计世代更替的贡献，我们把 h 乘以从调查1 
到调査 T 内出生年的均值的 改变： 

估计的世代内变化的贡献 tb ^ Cr - C ,) [4.3] 


其中， Cr 是最后一次调査样本中的平均出生年， C , 是第一次 
调査样本中的平均出生年。这两部分加起来通常不完全等 
于总变化，但差别不应该很大，如果差别很大，我们的线性一 
叠加假设就有问题，意味着我们应该用另一种分解方法。 

以下证明，在各部分与总社会变迁是线性的和叠加的关 
系的时候，将方程 4. 2和方程 4. 3所给出的各部分相加确实 
等于总的社会变迁。考虑把 Y 回归到年和世代的总体 模型： 

= ft + ft X 年,, + p 2 X 世代, t + e u [4. 4] 

在此，希腊字母代表总体的参数。同前， ft 是世代内 Y 的年 
变化， 氏是世 代间的斜率。世代间的斜率反映世代在不同的 
时点上 Y 的不同。如果所有世代在任何时点有相同的均值， 
则氏为0。 

Y 的均值（以 f 表示）是 Y 的期望值。在通常的假定 
E ( e ) =0下，由方程 4. 4可得最后一次调査(调查 T ) 的 Y 的 
均 值是： 
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y = e(y, t ) 

= £(^ 0 + 3 】 XSrr + ftX 世代 rr + err ) [4 

二氏+氏父玖年一 +氏/玖世代一+尺^) * 

= (3 o + Pi YR t + ft Cr 

(再次重复)在此， Cr 是最后一次调査的受访者的平均出生 
年。同理，第一次调査的 Y 的平均 值是： 

y, =p 0 +3 1 YR 1 +p 2 C, [4. 6] 

从第一次调査到最后一次调查的总变 化是： 

y T -y, = ^(yRt-yr^ + ^cCt-c,) [4.7] 

在线性一叠加情况下，简单的回归方法就可以把总变化 
Yt - Yi 分解为个人变化的部分和更替的部分。 
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第3节 | 实证案 例：歧 视黑人的趋势 


菲尔鲍和戴维斯用线性分解法研究了白人对黑人歧视 
的趋势变化 （Firebaugh & Davis , 1988)。首先，他们根据 
1972年、1976年、1980年和1984年美国综合社会调査的四 
个问题设计了一个歧视指数。这个歧视指数在1972年到 
1984年间下降了 1.22。把歧视指数回归到年和世代上，得 
到 b ! =— 0. 0457和 b 2 = — 0. 0508 (Firebaugh &- Davis , 
1988:表1)。把它们代入方程 4. 2,估计出的世代内的变化对 
总下降的贡献是 一0.0457 X (1984-1972) =_0. 55。 

在1972年样本中，白人的平均出生年是 1927. 2,在1984 
年样本中是 1939. 8。因此，由方程 4. 3,世代更替对总变化的 
贡献估计是 一0. 0508 X (1939. 8-1927.2) =_0. 64。把两部 
分加起来得到_1. 19,接近于观察到的变化_1. 22。我们得 
出的结论是，从1972年到1984年，美国传统的对黑人的歧视 
下降了，且该下降的一半或一半以上源自年长的、更带偏见 
的世代被年轻的、较少偏见的世代所代替。 
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第4节 I 代数分解 


1955年，埃 弗兰. 北川 （Evelyn Kitagawa ) 证明了两个人 
口群间比率(例如生育率）的差异是以下差异的函数： （1) 分 
年龄比率的差异（对分年龄比率的进一步分解，参见 Das 
Gupta , 1993;例子参见 Smith , Morgan &• Koropecky ]- Cox , 
1996); (2) 年龄构成的 差异； （3) 差异 （1) 与差异 （2) 的乘积。 
此处，我们要分解的不是在同一时点下不同人口群或者国家 
之间的差别，而是想分解同一个国家在不同时点下的差异， 
我们关注的是世代的构成变化，而不是年龄的构成变化。然 
而，逻辑上是相似的，只要进行一些修改，北川的分解方程 
( Kitagawa , 1955) 就可用于我们希望进行的这种分解。 

首先，我们把概念正式化，即一个群体的均值等于各子 
群在总体中的比重加权后的均值 的和： 

H = 2, Aw [4. 8 ] 

此处，; S 表示加总，是第 _/ 子群的 y 的均值， 丸 是第^子 
群占总体的比重加总后为 1. 0)。由此得到群体1和群体 
2均值之差 ( A M ) 是： 


= /i 2 — 

= SjA2M)2 _ 


[4. 9] 
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此处为区分群体1和群体2,我们用了下脚标。对方程 4. 9 
进行代数处理可得 ( Kitagawa ，1955)： 

Aju = 々△丸 + X ) ; A 内 △/>, [4. 10] 

此处，等于抑，即两个群体(例如国家)在子群 J 的 F 
的均值上的差，等于 办 ，即各群体中子群 J 占总体 
比重的差。方程 4. 10上的三个相加的项分别对应“比率”成 
分、构成成分和乘积成分。 

方程 4. 10是对比率进行分解的最根本的方程。为了把 
比率分解方程应用到分析社会变迁中，我们把它修改如下： 

用△表示随时间的 变化； 

用下脚标1和2表示调查1和调查2,而不是群体1和群体2; 
用下脚标 J 表示第世代。 


最后一项修改是重点。通过用 J 来表示世代，方程 4. 10中的 
第一项变成了 的加权和，即世代内 Y 的 变化。 这个加权 
和反映了个人的净变化对总变迁的贡献，因为个人的变化就 
是世代内的变化。如果总体内的各群体比重不变，对所有世 
代来说， AA 都等于0,那么方程 4. 10中的第二项和第三项 
都为0。在这种情况下，所有变化都来自个人的变化，方程 
4. 10的第一项理所应当捕捉了所有的变化。 

方程 4. 10中的第二项—— Ap , 的加权和，即世代在总体 
中比重的变化一用于反映世代更替。在个人不发生变化 
的情况下,等于0,第一项和第三项则都为0。在这种情 
况下，所有变化都来自世代更替，方程 4. 10的第二项理所应 
当捕捉了所有的变化。 

方程 4. 10的第三项反映的是 Ap 中不单纯源于个人变 
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化或世代更替的部分。这个共同作用通常相对较小，因为它 
是两项变化的乘积。达斯 • 古普塔建议把它平均地分布在 
第一项和第二项中 （Das Gupta ， 1987)。这个方法产生了一 
个包含两个组成成分的 方程： 

+/>,2)/ 2 ]知 + 2 ,[(W + Mjz )/ 2 ] △丸 

[4. 11] 

三成分(方程 4. 10) 与两成分(方程 4. 11) 分解法的差别只在于 
给 Art 和 △/>) 的权重。在三成分的情况下，第』世代的世代内 
改变由该世代在总体中的初始比重(它在第一次调査中占总 
体的比重)来加权，在两成分的情况下则由世代占总体的平均 
比重(九+ 办 )/2 来加权。同理，在三成分的情况下，第】世代 
占总体比重的改变由该世代的初始均值加权，在两成分的情 
况下则由该世代的平均均值来加权(两成分的分解法的一个 
变形将在后面分解对性别角色的态度改变的例子中提到）。 

需要重点强调的是，在重复调査中，如果没有固定样本 
成分，我们就只能随时间跟踪世代而不是个人。如果世代内 
的死亡率与 Y 相关，那么我们观察到的世代内的变化就是个 
人变化和源自死亡率的变化的混合物。用世代内的变化来 
估计个人变化，我们必须假定 Y 与世代内的死亡率不相关。 
这个假设有时候是有问题的，尤其在对群体的趋势进行分解 
而群体又有不同的分年龄的死亡率时。例如，在分解人口中 
共和党人的百分比变化趋势时，我们必须假定共和党人和非 
共和党人有着相同的分年龄死亡率。如果在重复调査中有 
可靠的固定样本成分，研究者就能检验这些假设。这是在重 
复调査中加人固定样本成分的原因之一。 
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第5节 | 实证案 例：再 论歧视 
黑人的趋势 


我们再把1972年至1984年的歧视黑人指数的总变化 
进行分解，这次使用代数分解法 ( SPSS 程序参看 F lr eb aug h ， 
1992)。我们用两成分的分解法，使之可以与线性分解法的 
结果相比较。估计值 如下: 个人变化=_0. 51，世代更替= 
— 0. 71。对应的线性估计值是 一0. 55和一 0. 64。因此，两种 
方法产生了本质上相似的 结论: 歧视黑人的下降同时源自个 
人变化和世代更替。然而，代数分解法更多地把这种改变归 
因于世代更替。 [6] 
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第6节 I 为什么总变化快于 
个人变化？ 


我们现在有更好的机会来理解为什么成年人经常抱怨 
变化太快了。当世代更替加强了个人变化且总变化快于平 
均的个人变化时，从典型的成年人的角度看，社会变迁实际 
上“太快了，，。 


斜率符号相同的规则 


在线性一叠加作用的标准假设下，当世代内和世代间的 
斜率有相同的符号时，总变化会快于个人变化。再考虑方程 
4.7,注意¥1^_'«? 1 总是大于0,且除非年轻人的死亡率大 
于年长者的死亡率，这种情况不太可能出现，否则 Cr 一 C ； 大 
于 0。 由此，只有在 择 和 择 同号时，个人变化和世代更替对 
变迁的贡献是同向的。由此得到斜率符号相同的规则 :假定 
年长成年人的死亡率高于年轻人，当世代内和世代间的斜率 
的符号相同的时候，社会变迁就快于一般成年人的变化。 

因为 ft 和氏是年龄作用、时期作用和世代效应的函数， 
所以这个相同符号规则可以与大多数社会科学家熟悉的概 
念相关联。考虑世代间的斜率氏。为什么成年人世代有差 
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异？ 一种流行的观点认为，由于在生命期内，他们被暴露在 
不同的历史状况下，所以出生于不同年代的成年人有不同的 
信仰、态度、价值等等。此外，如果态度在年轻人中更易变， 
在年长人中更坚定 ( Gleen ，1980) ，那么相同的历史事件对年 
轻人作用更大，也可能造成世代之间的差别。 

这些观点在两篇经典文章中被强调 ：卡尔 • 曼海姆 
(Karl Mannheim ) 的《关于代的问题 KT/ie Problem of Gener - 
afton ) 和诺曼 • 莱德 (Norman Ryder ) 的《世代作为研究社会 
变迁的概念》（了& Cohort as a Concept in the Study of Social 
Change ) 。 它们都假定，刚进人成年人世界的年轻人比已经 
在那个世界中的人更容易改变，因为年龄更大的人更坚持他 
们年轻时获得的看法。曼海姆写道：“早年的印象易于形成 
为对世界的自然看法。” （ Mannheim ， 1927/1952: 298) 因此， 
“所有具体经验都从它与初期的经验层的联系中获得它的特 
有表象和形式”，曼海姆认为这些经验在大约17岁时获得。 
莱德写 道:“ 每一个新的世代都与当代的社会遗产发生新的联 
系，且这种相遇的烙印会保留一生。” ( Ryder , 1965:844) 简言 
之，“世代在生命的早年发展出特有的世界观定义，而这些看 
法似乎将持续整个成年期 ’’(Lesthaege Surkyn , 1988:40)。 

当年长的世代被后来的世代所代替，世代的“特有的世 
界观定义”会引起社会变迁。这就是孔德在书中说，“我们社 
会过程依赖于人的死亡”的含义 ( Comte ， 1839/1974,第6卷， 
第6章:518)。莱德进一步主张，社会变迁一旦开始，就可能 
因为一系列内在的动力而持续 ( Ryder , 1965)。这个动力来 
自“人口新陈代谢”的双过程——持续的年长世代的逝去和 
年轻世代的加入——和世代 差异。 如果“世代的意义被植 
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入”，变化将预示进一步的变化 （ Ryder , 1965： 861) „为了植 
入世代的意义，“社会世界的变迁必须用不同方式改变不同 
年龄的人”，且“这些变迁的作用（必须)持续” ( Ryder ， 1965： 
861)。因为社会变迁对年轻人有更大的作用，所以改变将延 
绵到未来，因为年长的、受影响更少的世代逐渐逝去，而年轻 
的、受影响更大的世代加入了成人世界。 

简言之，社会变迁既有即时的、可观察到的影响（因为它 
一定会影响现有人口的部分成员），也有延迟 影响。 在一个 
没有世代延续的假设世界里，社会变迁的作用将只是即时 
的，或者如果是延迟的，就只是延迟的，因为它需要时间来让 
影响在人口中传播。在现实世界中，世代延续“放大”了社会 
变迁的作用，这种放大不是通过传播，而是通过使人口构成 
从受影响更小的世代改变为受影响更大的世代。 

因此，在莱德的模型中，总变化快于一般人的变化是由 
于世代效应与时期作用互补。由同号原则，我们可以更正式 
地推导出在什么样的年龄一时期一世代的情况下，总变化快 
于个人变化。 


斜率同号原则和年龄一 flt 期一世 代效应 


世代内和世代间的斜率的符号取决于年龄、时期和世代 
效应的符号和相对大小。这在包含所有三种作用的线性一 
叠加模型中最容易看 明白： 

= (3 o + PpX 时期 ,, +jfc X 世代 , t + p A X 年龄 n + e „ 

[4. 12] 
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尽管方程 4. 12描述的模型不能被估计，但它可以用年龄一 
时期一世代效应来证明同号原则的含义 • 把方裎 4. 12中的 
年龄用(时期一世代)代替， 得到： 


= 13 o + (|3 p + |3 a ) X 时期 „ + ( pc - p A ) X 世代 , t 十 e lt 




[4. 13] 

比较方程 4. 13和方程 4. 4,我们得到以下重要 结果: 


世代内的斜率 ： ft = 

- pp + (3 a 

[4. 14] 

世代间的斜率：乐= 


[4. 15] 


在考虑年龄和世代效应的符号时，记住年龄和世代是从相反 
的方向来编码的。在任一给定的时点，那些在年龄上编码较 
低的人,在世代上编码则较高，因为他们出生得更晚。 

从方程 4. 14和方程 4. 15中，我们可以很直接地判断出 
什么时候 ft 和乐会在线性一叠加模型中有相同的符号。如 
果氏> Pa ，世代间的斜率氏则为正;如果 pc < |3 a ,世代间的 
斜 率氏则 为负。因此，在个人变化为正的情况下，即氏 >0 
时，那么在且只有在 Pc > Pa 的情况下，总变化才快于个人变 
化。这个条件没有对年龄和世代效应的符号进行任何限制， 
它们可以同时为负，只要在数轴上， |3 A 在氏的左边，世代间 
的斜率就为正 （ p A <|3 c )。 在个人变化为负的情况下，即氏< 
0时，那么在且只有在 (3 c < p A 的情况下，总变化才快于个人 
变化。同样，它对 |3 c 和 (3 a 的符号没有任何限制，重要的只是 
它们在数轴上的相对位置。 

总而言之，在线性一叠加的标准假定下，当总变化和个人变 
化同向时，在且只有在以下情况下，总变化会快于个人变 化:如 
果是上升趋势，则为氏 > 〜如果是下降趋势，则为 (3 c < Pao 



I 分析貢 ft 调査数据 

第7节 I 斜率符号相同原则的 实例： 
关于性别角色的态度 


近几十年来，大量女性参加有薪工作，这是一种很可能 
会对年轻人的态度产生巨大影响的社会变迁。与莱德的研 
究相对应，在美国人对性别角色的态度的问题上，人们预期 
世代效应和时期作用将会互补。 

为了检验这些预期，我把美国综合社会调查中重复得最 
多的四个关于性别角色的问题作为分析的数据(表 4. 2)。第 
一个问题是关于女性的有薪工作 ( WORK )， 接下来的两个问 
题是关于女性的政治参与 ( PRES , POLI ) ，第四个问题似乎 
同时包含政治和“家庭生活”的维度 （ HOME )。 表 4.2 中的 
“加权”指为美国综合社会调查中低估的已婚人士而进行的 
调整。 [7] 然而加权没有产生任何影响，所以在后面的表格中， 
我只汇报没有加权的结果。 

1972年，65%的受访者说,即使女人的丈夫可以支持她 
的生活，他们仍然认可她去参加有薪 工作; 1988年，80%的人 
表示支持此行为(表 4. 2) 。相似的变化模式也出现在其他关 
于女性角色的问题上(有趣的是，这些百分比并不因受访者 
的性别而异）。1972年，74%的人说他们会投票支持一位合 
格的女性提名人当 总统; 1988年，88%的人说他们会这么做。 
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1974年，略高于半数的受访者不同意“大多数男性在性情上 
比大多数女性更适合参与政治”;1988年，大约2/3的人不同 
意这个说法。那些不同意“女性应该照顾家庭，把治理国家 
让给男人”的人从1974年的64%上升到1988年的79%。 

表 4. 2美国对性别角色的态度转变 



1972年均值 a 

1988年均值 

变化 

WORK : 如果已婚女性的丈夫可以 
支持她的生活，你同意还是不同意她 
从生意或工业工作中赚钱？ （1 =同 
意,0 =不同意） 




不加权的样本 

0. 654 

0. 804 

0. 150* 

加权的样本 

0. 652 

0. 807 

0. 155* 

PRES : 如果你的政党提名一位女性 
为总统，且她能做好该工作，你是否 
会投票给她？（1 =会> 




不加权的样本 

0. 737 

0. 879 

0. 142* 

加权的样本 

0. 737 

0. 879 

0. 142* 

POLI : 告诉我你同不同意这句 话:大 
多数男性在性情上比大多数女性更 
适合参与政治。 （1 =不同宥） 




不加权的样本 

0. 532 

0. 667 

0 135* 

加权的样本 

0. 530 

0. 670 

0 140* 

HOME : 你同不同意这 句话: 女性应 
该照顾家庭，把治理国家让给男人。 
(1 =不同意） 




不加权的样本 

0. 644 

0. 788 

0. 144* 

加权的样本 

0. 643 

0. 791 

0. 148* 


注: a * POLI 和 HOME 为1974年的均值。 

. 表 7 K p <C 0 . 0001。 

总变化的速度是否快于一般成年人态度的改变速度呢? 
表 4. 3为四个关于性别角色的问题汇报了世代内和世代间 
的斜率的估计。对这些问题的回答是二分变量，所以在统计 
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分析霣复调 查 败据 


上我们需要用 logistic 回归。对于这四个问题，世代内和世 
代间的斜率都同号(普通最小二乘回归得出的结果是一样 
的）。根据刚刚推导出来的条件，我们得知，关于性别角色的 
观念在成人世界中的整体变化速度要比一个典型的成年人 
变化得快。 


表 4. 3世代内和世代间的对性别角色的态度改变的估计 :10glt 系数 


性别角色测量 

世代内 （f l) 

世代间 （f 2 ) 

WORK 1972—1988(N= 14376) 

0. 029* 

0. 032 * 

PRES 1972—1988(N = 14188) 

0. 029* 

0. 031 * 

POLI 1974—1988(7V = 11058) 

0. 029* 

0. 024* 

HOME 1974—1988(N= 12665) 

0. 029* 

0. 035 * 

注： *户<0.01。 



表 4.4 活着的成年人对性别角色的态度改变的估计(1972[1»74] — 1988 年） 

变化 

性别角色问题 

总变化 a 

活着的人的变化 11 

WORK 

0. 150 

0. 087 

PRES 

0. 142 

0. 089 

POLI 

0. 135 

0.036 

HOME 

0. 144 

0.065 


注: a _ 从表 4. 2而来。 

b. 活着的成年人的平均 变化- 计算方法参见正文 - 


代数分解法得出的结论相同。对这四个问题中的任何 
一个，支持性别平等的回答在1988年比在1972年或1974年 
多15%。「《我们可以通过代数分解来将这 15 个百分点的变 
化与活着的成年人的变化做比较。 

因为想知道活着的人的变化，我们用世代在时点2时所 
占总体的比重对世代内的变化进行加权，而不是用 
世代在时点1时所占总体的比重。我们用 2,^(^-^.) 



第 4 章分解总趙势 I 


61 


来估计活着的一般成年人的变化。 [9] 

表 4. 4汇报了结果。对所有四个问题，活着的人的平均 
变化明显慢于总变化(因为活着的人的均值距离最大值比所 
有成年人的均值距离最大值远，活着的人更慢的变化不能归 
因于天花板效应）。总的来说，那些支持“在已婚女性的丈夫 
可以支持她的生活的情况下，女人仍可以从生意或工业工作 
中赚钱”的人增加了 15个百分点，而对活着的成年人来说， 
则增加了 8. 7个百分点。1988年,88%的人说，如果他们的 
政党提名一个合格的女性做总统，他们会投票支持，这比 
1972年增加了 14%;对仍然生存的成年人来说，这个百分比 
则增加 8. 9%。其他问题表现出相似的变动。 

简言之，表 4. 4的结果与斜率同号原则的预测一致。在 
美国，对性别角色的态度在成年人社会中的变化总的来说比 
典型的成年人快。 
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分析重 复谓査 敝据 


第8节 I 总结 


如何把微观过程和宏观过程联系起来是社会学一直在 
讨论的一个话题 （ Alexander 、 Geisen、Munch & Smelser ， 
1987； Coleman , 1986； Durkheim , 1895/1938)。 线性一叠加 
例子中的斜率同号原则与这种联系有关，它给为什么总变化 
有时候快于个人变化提供了线索(当然，在现实世界中，作用 
可能是非线性的和交互的 [ Elder , 1974], 然而，线性一叠加 
的理想类型是一个很有用的起点）。这个线索就是，当世代 
内和世代间的斜率有相同的符号时，成人世界的变化快于其 
中一般成年人的变化。用年龄和世代效应来表述，斜率符号 
相同的原则意味着在上升趋势下， 13 c > Pa , 在下降趋势下， 
Pc < P A o 在这两种情况下，社会的变化都快于个人的变化。 



分解总变化的一般模型 
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分析震复调査数据 


上一章介绍了两种从社会变迁中分离世代更替作用的 
方法。在隔离世代更替成分的时候，我们关注的只是我们所 
观察到的变化发生的来源，这些变化来源于人口更替还是个 
人变化？由于目的是确定变化的来源，所以这个分解方法并 
不通过加入变量来解释为什么个人发生了变化,或者为什么 
不同的世代有所不同。 

本章用因果变量来回答变化的问题。目的是展示一个 
一般模型，该模型用其他变量自身和作用在时点1到时点2 
的变化，来解释一个变量在相同时间内的总变化。这个模型 
假定只有两个测量时点（而线性分解中有 T 个时点）。因为 
这个模型在形式上与人们熟知的回归标准化模型一样，所以 
在此没有必要用新的分析来展示它，而只需要依赖已有的研 
究。我使用的研究案例是在政治科学文献中1960年后美国 
选举投票比例下降的奇怪现象。 
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第1节 I 模型 


我们来考虑简单的线性回归模型， y 是 x 的一个 函数： 
Y = a +|3 X+e [5.1] 

如前所述(方程 4. 5) ，在传统的假定 E ( e ) = 0下， y 的均值 
是它的预 期值： 


y = E ( Y ) 

= £(a + j 3 X + e ) [5.2] 

=a + pX 


方程 5. 2 指出，回归线会穿过点（叉， F )。 因此，我们可以用 
X 的均值来得到 Y 的均值，即用 X 的均值乘以斜率再加上截 
距。此处更重要的是，方程 5. 2告诉我们， y 的均值可以用 
以下三个部分表示出来 ：（1) X 的 均值； （2 )X — Y 关系的斜 
率; （3) 截距。 

因为 y 可以用 x 、 回归斜率和截距来表示，所以 y 的变 
化可以用 x 的变化、斜率的变化和截距的变化来表示。加人 
下脚标来表示时间，由方程 5. 2可得 Y 的均值的变 化为： 

Y 2 — Y] = (oi2 + ^X 2 ) — (m + (3i Xi) 

=(oi2 _ oti) + (^X 2 — (3iXi) 

= — a:) + (PeX 2 — PjXj) + — P2X1) 
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+ (Pi X 2 — P]X 2 ) + (pjXi — Pi X]) 

=(a 2 — ai ) + ((i — Pi )Xj + Pi (X 2 — Xi) 

+ ((32 — Pi )(X 2 _ Xi) 

=Aa + A|3Xi + |3i AX + A^AX [5.3] 

总而言之, f 的变化可以分解为四个部分，分别反映在截距 
的变化 ( Aa )、 解释变量的均值（△叉)的变化和解释变量的作 
用 ( Ap ) 的变化上(其他分解方法也是可能的，把方程 5. 3中 
的四个部分用不同的方式相加，可以变成三个部分或者两个 
部分）。我们可以发现，与第4章所讲的回归方法不同的是， 
这里的分解是完全的，这些部分加起来等于 Y 的变化。 

熟悉回归标准化的读者会发现，方程 5. 3与回归标准化 
的分解方程的形式是一样的 （ Sobel ， 1983:公式4)。不同之 
处在于，这里的下脚标1和2表示时间，而不是群体。回归 
标准化，正如它的名字所暗示的那样，是用回归来标准化分 
布的方法。通常来说，其目的是将两个群体的分布标准化， 
以去除由于构成不同而造成的两个群体在因变量上的差异。 
举例来说，研究收人上的性别歧视经常运用回归标准化法来 
调整男女工人在年龄、每周工作时间、工作经验等方面的 
不同。 

因为我所提出的分解总变化随时间变化的模型（方 
程 5. 3) 在形式上与用于分解两个群体之间均值差异的回归 
标准化法一样，回归标准化法的内在问题也存在于用方 
程 5. 3来分解变化上。这点很重要，因为回归标准化法受到 
“起点依赖”或“位置变化”问题的困扰 （Clogg Eliason , 
1986; Firebaugh , 1992; Jones &- Kelley ，1984)。 问题是这 
样 的:给 X 加入一个常数，我们就改变了方程 5. 3 前两部分 



第 5 車分解总变化的一般横型 


67 


的大小。实际上，除非 X 有可靠的零点，否则只要改变 A •的 
起点，即给 X 加人一个常数，截距的改变 （ A «) 对总变化的贡 
献就可以变成任意大小。 

为了更好地理解这个问题，请首先注意方程 5. 3的第三 
部分和第四部分没有起点依赖的问题。第三部分 A 又是 Y 
的均值的总变化中完全来自解释变量的均值变化的部分。 
第四部分 ApAX 是总变化中来自斜率变化和均值变化的共 
同作用的部分。这些部分没有起点依赖的问题，因为给 X 加 
一个常数不会影响 X 均值的差△又。然而，给 X 加一个常数 
会改变 X 的均值，所以除非 Ap = 0,否则就等于给第二部分 
增加了一个恒定的作用。由此可知，增加一个常数也 
会影响 Atx ， 因为以下方程必须 平衡: 由方程5.3, Aa = AY - 
(ApXj +^AX + ApAX ) 可知，给 A •加一个常数，不会影响 
AY , ftAX 和 A (3 △又(但是 A (3 X , 会受到影响），所以很显然， 
△ C (也 会受到影响。 

简言之，除非 X 的作用是恒定的(△卩= 0) ，否则 Aa —— 
y 的变化中不能被 X 自身及作用的变化所解释的部分一 
可以通过给 X 加人一个常数使之向对研究者有利的方向改 
变。例如，通过给 X 加入一个适当的常数，我们可以使 Aa = 
0,然后宣称歹的变化全部来自 X 自身及作用的变化。或者 
我们可以给 X 加一个常数，使截距的差别等于歹的差别（即 
我们可以使其他几部分加起来为0)。因此，用一样的数据和 
变量，一位研究者可以声称， X 自身及作用的变化可以解释 
所有 Y 的均值的变化 (△(» = 0) ，而另一位研究者可以声称， 
X 自身及作用的变化完全不能解释 Y 的均值的变化 (Aa = 
AV , 因此与 X 有关的部分的贡献相加后为 0) 。 
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有两种方法可以解决这个问题。最好的方法就是选择 
有非任意零点的自变量( X )，也就是选择定比层次的测量。 
在定比变量里，零点是固定的，截距的位置也固定，所以可以 
有唯一的分解方法。如果不能得到定比的测量，研究者可以 
合并方程 5. 3的前两部分，得到以下的几个部分 （ Sobel ， 
1983): “+邹元，参数变化的贡献(注意，这里用了不同的 
术语“参数变化”，指的是截距的变化以及斜率的变 化）； 
PiAX , X 自身的变化的 贡献； ApAX , X 自身及作用的变化 
的贡献。 

这里的底线是，区分截距改变的作用和斜率改变的作用 
要求有定比的测量。至少我们要注意到，当截距可以任意移 
动时，短语“截距变化的作用”没有实质含义，这是该方法的 
一个缺陷。当截距的位置是任意的时候(正如在以定距测量 
自变量 X 时）， A a 不过是用来使方程 5. 3平衡的项。 
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将方程 5. 3的分解扩展到多个解释变量的情况也很 
直接。为了便于说明，用向量来标记更简便。用 X 表示一 
个 1 X 9 的自变量的行向量，用 P 表示一个 9 X 1 的参数的 
列向量。由此 y 的均值可以表示为？ = E ( a + X |3+ e ) = 
«+&肖，此处又是一个1/ 9 的叉的均值的向量。再用下 
脚标来表示时间，可得 Y 的均值从时点1到时点2的变 
化为： 

Y 2 _ Vi = ((I2+X2P2) _ (ai + Xipi ) 

=(Ot2 _ Otl ) + X! (pz — (3l ) 

_ _ _ _ [5.4] 

+ (x 2 -x 1 )p I + (x 2 -x 1 )(^-3,) 

= Aa + XjApi - AXp , + AXAp 


我们不应该把方程 5. 4 和第 4 章介绍的线性分解法混 
淆。首先，方程 5. 4的模型是基于两个截面数据，而第4章 
的模型使用所有的截面数据。第二，方程 5. 4的分解模型允 
许解释变量的作用发生变化，而第4章的模型假定参数（包 
括截距）不随时间发生变化。如果我们假定方程 5. 4中 
Aa = AP ==0, 则模型可以简化为第4章模型中的 AY = AX (3 
形式(参见方程 4. 7)。第三，方程 5. 4的分解法是一个灵活 
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分析 重 戴调查数据 


的模型，可以有不定数量的自变量。相反，第4章的分解法 
是根据特定的目的而设计，即从世代内变化的作用中区分世 
代更替的作用，所以相同的自变量——测量年份和出生年 
份一总是被使用。 
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第 3 节 I 例子 ：美国 选举中 
投粟比例的下障 


为了演示方程 5. 4所提供的分解框架的可能应用，我们 
来分析在过去几十年中，美国的全国选举中投票比例的变化 
趋势。美国的投票率在 I 960 年肯尼迪一尼克松总统选举过 
后的30年间都在下降，除了在1992年的选举中出现过反弹 
(Abramson et aL , 1994)。从个人层次影响投票率的因素的 
变化来看，这个长时期的投票率下降特别有趣。举例来说， 
选民的教育水平自 I 960 年后都在上升，并且我们知道，正式 
教育与投票可能性之间有很强的正向关系 （Wolfinger 
Rosenstone , 1980)。根据教育的变化趋势，我们预测投票率 
会上升，而不是下降。 

有极为丰富的实证研究文献（文献回顾请参见 Abram ¬ 
son et al . , 1994:第4章)试图解答这个美国投票率的“谜题” 
( Brody , 1978)，即在选民越来越多、受教育程度越来越高且 
登记为选民的要求越来越低的情况下，投票率却越来越低的 
谜题。美国对投票参与进行了长时间的且令人敬佩的实证 
研究（例如， Campbell 、 Converse、Miller Stokes ，1960； 
Kleppner , 1982； Merriam &- Gosnell , 1924； Verba &• Nie , 
1972; Wolfinger &- Rosenstone , 1980) ，对投票率谜题的研究 
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分析重 复调奎 数据 


受到了这一传统的 启发。 对投票参与的研究得出了一系列 
与投票行为有关的人口学因素和态度因素 (Bennett Ben ¬ 
nett , 1987)，从这一系列因素中，艾布拉姆森和奥尔德里奇 
认为，其中两个因素与投票率下降最有 关系： “投票参与的下 
降主要来自两个基本的态度变化 趋势: 美国选民对政党忠诚 
的弱化和对政府反应的不信 任 。” （Abramson Aldrich , 
1982:502)特谢拉的全面分析得出了相同的结论0^^匕， 
1987、1992)，并指出另一点与投票率下降联系在一起的因 
素，即“社会联系的明显下降表现为选民更年轻、更少人结 
婚、更不常参加礼拜” ( Teixeira ， 1992:57)。 

艾布拉姆森和奥尔德里奇的研究与特谢拉的研究得出 
的结论是一致的，这点值得我们注意，因为他们使用了不同 
的分解方法。他们都是用累积的全国选举研究数据(开始于 
I 960 年)，并用虚拟变量来表示选举年，研究投票参与随时间 
的变化。然而，艾布拉姆森一奥尔德里奇分析使用斜率变化 
模型以允许两个解释变量的作用可以随时间而变化。特谢 
拉使用了更多的解释变量，但是(除了一些补充的回归以外） 
假定它们的作用是随时间不变的，也就是说，他假定 AP = 0。 
把 AP = 0代人上面的方程 5. 4,我们可以更好地理解特谢拉 
分解任意两次选举中投票率不同的 方法： 

Y 2 - Y, = Aa+^Ap + AXp, +AXAP 

— 5 ] 

= Aa + AX^i 


换言之，特谢拉的方法把投票率下降分解为△又 ft ，即构成效 
应(来自自变量 X 的均值的变化部分），&&△<*，即不能被自 
变量 X 解释的变化。 
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在分解投票率下降时，特谢拉检验了把自变量 X 加人模 
型后截距 （ Act ) 的变化（模型中 △<* = ( Y 2 - Y 0 - AXpi ) 
( Teixeira , 1987、1992)。“如果加人一个变量后，这些系数 
的大小显著地下降，这就意味着那个变量的分布变化对投票 
率下降有重要影响。” （ Teixeira , 1987： 45； 1"2:196)将方程 
5.5 和方程 5. 4相比较，我们注意到，这个解释假定 X 的作用 
是恒定的0)。如果 X 的作用随时间不变，我们可以解 
释说,从时点1到时点2的截距的变化是 Y 的均值的变化中 
不能被解释变量说明的部分。 [W] 

作为一种与特谢拉分析投票率下降的叠加分解模型不 
同的模型，我们可以用方程 5. 4的模型。方程 5. 4的模型更 
为一般化，因为它包含了解释变量作用改变的贡献(如果有 
改变）。考虑从 I 960 年到1988年8次总统选举投票率的下 
降。我们可以把这个下降用一步分 解为： 

Ygs _ = △() [十 Xgo Ap AXj3eo + AXA^o C5. 6] 

换言之，我们只用 I 960 年和1988年的数据进行分解,忽略期 
间六次选举的数据(重复一下，如果一些自变量 X 不是定比 
层次的，方程 5. 6中的第一项和第二项就需要合并）。或者 
我们可以相继地分解变化以使用全部八次选举数据一首 
先分解从 I 960 年到1964年的变化，然后是1964年到1968 
年的变化，如此类推一之后再相加。我推荐第二种方法， 
尽管它更费力。 
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第 4 节 I 总结 


本章展示了一个一般的模型，它可以把 y 的总变化分解 
为解释变量自身的变化(构成作用）、解释变量的作用的变化 
和截距的变化。这个模型可以作为研究社会变迁的模板。 
然而，研究者不应该机械地使用这个方法。分解方法基于它 
所使用的解释变量，只有在解释变量有意义的时候，分解才 
是有意义的。举例来说，我们可以把分解方程应用到任何变 
量上，只要这些变量跟投票有关，并且在过去30多年中表现 
岀向上或者向下的趋势，就可以声称“解释”投票率下降的问 
题。这样机械的运用方法也许能得到统计上显著的结果，但 
却不能告诉我们社会世界的任何有用信息。 


发掘个人层次关系的变化 
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分析 重复调 cat 据 


本书的内容是分析社会变化。迄今为止，我关注的是总 
变化，然而术语“社会变迁”有时候指的是个人层次关系的变 
化。本章将介绍如何对重复调査数据使用简单的回归模型 
来检验解释变量的作用是否随时间改变。 
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在本章中，术语“参数变化模型”指的是用于研究 AP ， 即 
自变量 X 的作用变化的模型。正如上一章介绍的那样，作为 
总变化的一个部分，研究者也可以研究参数的变化。然而， 
在本章中，我关注对参数变化本身的研究，而不是研究他们 
对更大的社会变迁的贡献。因为个人层次作用的变化本身 
就很有趣，所以可以独立使用参数变化模型来分析。 

我用交互项来反映 X 作用的变化。如果一个变量对另 
一个变量的作用受到第三个变量 Z 的层次的影响，就出现了 
交互作用。我们说 X 的作用随时间变化，也就是说， X 的作 
用受时间影响。这是从经典意义上来理解交互作用这个术 
语的例子。 

我所用的交互项的形式是 X 乘以 Dvr ， 其中 Ek 是一个 
虚拟变量，当它指某一年（或者月、周，取决于测量的频率） 
时，取值为1。正如我们将看到的，解释变量 X 既可以是连 
续的，也可以是分类的。 

假设我们想知道，在美国，决定人们政党身份的因素在 
1994年与20多年前是不是一样，我们可以做两个平行的分 

析- 个使用1974年的数据 ，一 个使用1994年的数 

据——来比较系数。用这种方法立刻可以很明显地看到哪 
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分析重复调査数揖 


些差别是显著的，哪些是不显著的。为了检验来自个别样本 
(这里是个别年份)的样本系数的不同是否在统计上显著，我 
们必须进行合适的显著性检验。一种方法是对各个样本分 
别进行回归分析，再用朗和麦尔德给出的方程对我们感兴趣 
的差别 进行？ 检验 (Long & Miethe , 1988:125—129)。然而 
在有重复调查数据的情况下，这个方法不必要，因为数据搜 
集者经常把新的样本和以前的样本合并。有了这样的累积 
数据，通过增加一个交互项来估计一个模型更容易检验参数 
的变化，这就是我在这里要介绍的方法。 
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第2节 I 模型的一般形式 


用向量来表示，参数变化模型的形 式为： 

E ( Y ) = « + yD YR + Xp +( XD YR )S [6. 1] 

是表示年份的虚拟变量, X 是 DvrW 外的一组预测变量的 
向量， (3 和 S 是参数的向量。如果在向量 X 中有 q 个变量，那 
么 X 和 XDvr 各有 1 X q 的维度，且 |3 和 S 各有 q X 1 的维度。 

方程 6. 1用最一般的形式来表示模型，每个自变量都有 
对应的交互项。我只是为了展示出这个模型的适用范围。 
在使用这个模型时，研究者经常会只给自变量 X 的一个子集 
加上交互项，尤其是当自变量很多的时候。给模型加交互项 
的原则与给模型加自变量的原则是一样的，即必须有好的理 
由（理论、已有的证据或者有理的论据)以使人相信这个变量 
是有作用的。滥用参数变化模型的最大危险在于，研究者 
“漫无目的地探寻”随时间变化的作用。这类交互项只有在 
我们相信自变量的影响随时间而变化时才加入模型。如果 
交互项被随意地与很多自变量一起加人模型，样本系数的有 
些变化可能只是因为偶然的原因而在统计上显著，参数的真 
正变化却可能由于多重共线性导致标准误变大而变得不 
显著。 
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分析霣 复调*数据 


从具体的事例来考虑，通常都可以帮助我们思考。请考 
虑从1974年到1994年决定人们政党身份的因素有没有发 
生改变这个例子。美国综合社会调查包含以下的问题 :“总 
的来说，你一般把自己看做共和党人、民主党人、独立人士， 
还是其他?”编码从0 =很强的民主党人(认同嬅)到6 =很 
强的共和党人(认同感）。如果假定在这个问题中，独立人士 
(编码为 3) 作为一个单独的维度处于中间位置，我们就可以 
把它作为测量共和党人身份认同强度的变量。为了与后面 
的介绍一致，如果我们改变编码方向为6 =很强的民主党人 
(认同感），并用1974年和1994年的美国综合社会调査数据 
来估计这个模型， 那么： 

E ( Dem ) = a + yD 9i + Xp + ( X ' D 94 )S [6. 2] 

此处， D 94 是一个虚拟变量，当年份是1994年时，取值为 1 ，X 
是一个1 X q 的变量的向量，被认为会影响对民主党的政党 
认同， f 是一个 1 X p 的变量的向量，它包含了 X 中的一部分 
变量(或者当 P = q 时 ， t = X )。参数 a 是1974年时的 > 的 
截距，《+7是1994年的截距。向量 P 包含 q 个预测变量 
X ：, X 2 , •••, X p , •••, Xq ，对应的参数是氏，,…， (3 P ，…， 
氏。 X p+1 , X p+2 , X q 对应的 (3 表示预测变量的直接作 
用，它们被认为在1994年时的作用与在1974年时相同。与 
之不同的是，足， X 2 ，…， X p 对应的 p 表示预测变量在1974 
年的直接作用，这些变量的作用被假设为从1974年到1994 
年发生了改变。所以， ft 是1974 年足 对民主党身份认同的 
直接作用， ft 是1974年 X 2 对民主党身份认同的直接作用， 
等等 ，而兄，及 ，…， X p 被假设为在1974年的作用与在 
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1994年的作用不同。 

请注意，参数变化模型允许 X 的作用随时间变化，但是 
不包含其他类型的交互项。例如，在运用方程 6. 2的时候， 
我们可能检验地区(南方对非南方）和教育对民主党身份认 
同的作用，看地区和教育对政党身份认同的作用在近几十年 
是否发生了变化。在使用方程 6. 2的时候，我们假定教育对 
政党身份认同的作用在南方和非南方是一样的。当然，这个 
假设可以通过加入地区 X 教育这个交互项来检验，此处地区 
是一个虚拟变量。因为在参数变化模型中加人这样一个交 
互项很直接，所以我认为没必要在这里加入这一项把标记弄 
复杂(不熟悉这种交互项的读者可以参看标准的统计教材， 
例如 Agresti Finlay , 1986)。参数变化模型的要点在于检 
验 X 的作用是否随时间变化，这是我们此处的关注点。 
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分析 重 复蠲 ft 数据 


第 3 节 I 作用变化的显著性检验 


在这里，方程6.2的交互项«!^)8是重点，因为它显 
示了 X 的作用是否随时间变化。向量¥0 94 包含变量 
X , D 94 , X z D 94 , X p D 94 ，此处 XD 94 是 1994年对应的足 
且在1974年为0, &0 94 对应的是1994年的 X 2 且在1974 
年为0,等等。因此，向量 S 表示的是1974年到1994年间 
X ,, X 2 , X p 的作用的变化(例如 A 是足作用的变化）。 
因为从 ft 到 pp 反映的是自变量 X 在1974年的直接作用，由 
此可得 X '在1994年的直接作用是 ft + S , ，在1994年 
的直接作用是 p 2+ S 2 ，等等。 

我们可以检验单一交互项的统计显著度，也可以同时 
检验一组交互项。单独系数的检验用《检验，同时检验多个 
交互项用 F 检验 （Long Miethe , 1998 )。 SPSS 和 SAS 之 
类的程序软件包通常都会给出各个系数的 t 值。要同时检 
验多个交互项，我们需再次估计 X 的作用，但这次不包含交 
互项： 


E ( Dem ) = a r + y r D 94 + X ^ [6.3] 


此处，下脚标 r 用来区分简化模型中的参数和完整模型中的 
系数，简化模型如方程 6. 3所示，完整模型如方程 6. 2所示。 
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恰当的 F 检验 为： 

F = [( SSE ^- SSEJ / pl / CSSEe / CN - k )] [6.4] 

此处， SSE ； 是在简化模型中的误差平方和， SSE t 是在完整模 
型中的误差平方和， k 是完整模型中的参数的数量， P 是交互 
项的数量， N 是样本量(方程 6 . 4 可以重写为用 i ? 2 的差来表 
示的形式，有些读者可能对这种形式更熟悉。这也是有些统 
计软件，譬如 SPSS 使用的形式)。如果一组交互项不能减少 
误差平方和，那么 SS & cSSE ；， 且 F =0, 所以 F 在这种情 
况下是检验零假设，即交互作用共同为0,也就是& = 
82 =…= S P = OCAgresti &- Finlay , 1986:456 )。 如果我们 
不能拒绝这个零假设，我们就认为自变量 X 在 1974 年的作 
用与在 1994 年的作用一样(在 logistic 回归的情况下，显著性 
检验是基于卡方检验而不是 F 检验 ) 。 
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第 4 节 I 两个简单的例子 


用交互方法来研究个人层次关系的变化很灵活。自变 
量 x 可以是连续的，也可以是分类的，也可以两者都有。对 
连续的 X ， S 是斜率的变化。对分类的 X ， S 是分类均值的 
变化（或者在其他变量是连续变量的情况下， S 是截距 
的变化)。 

在 X 为分类变量的情况下，我们假设从1974年到1994 
年民主党身份认同的地区差异(南方对非南方)变小了。我 
们可以通过以下合并了 1974年和1994年数据的模型来检 
验 假设： 

= a + yD 94 + (3 X 地区 + SX 地区 X D 94 [6.5] 

此处，地区是一个虚拟变量，当（受访者)居住在南方时取值 
为1。因为£> 94 在1974年时取值为0,所以 p 是1974年的区 
域差异, S 是1994年和1974年的区域差异之差。因此 ， S = 
0意味着1994年和1974年的区域差异一样。如果 S 和 p 不 
为0,当 S 和 p 同号时，1994年的区域差异（比1974年)更大， 
当 S 和 P 异号时，1994年的区域差异更小（除非在 S 在绝对 
值上是 P 的两倍以上）。无论地区的编码是1 =南方或者 
1 =非南方，这个结论都成立。 
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现在我们来考虑 X 为连续变量的情况。如果我们假设， 
在美国教育和民主党身份认同的双变量关系发生了改变，我 
们可以通过以下模型来检验这个 假设： 

= a +yA4+(3X 教育 + SX 教育 XD 94 [6.6] 

正如在方程 6. 5中的情况那样，相同的原则在方程 6. 6中同 
样 成立。 当 S 和 p 同号时，教育在1994年的作用比在1974 
年更大;当 8为0 时，教育的作用不变 (1974 年的斜率与1994 
年一样）；当 S 和 (3 异号时，教育在1994年的作用比在1974 
年更小，除非 S 的大小是 p 的两倍以上。方程 6. 6和方程 
6.5 之间的重要差别是，方程 6. 6中的参数表示的是斜率和 
斜率之差。在方程 6. 6中，|3是1974年的教育的斜率，而 S 
是1994年与1974年的教育的斜率之差。 



分析霣复调査数据 


第5节 | 参数变化分析的 步骤： 
种族与民主党身份认同 


文献中经常提及美国黑人比白人更可能参与民主党并 
投票给民主党候选人 （Abramson et al . ，1994:第5章）。也 
有证据表明，参与民主党的种族差异正在扩大 （Abramson et 
al . , 1994:第8章）。在这里，我使用1994年的美国综合社会 
调查数据和在那之前20年的美国综合社会调查数据，运用 
参数变化模型来检验在美国参与民主党的种族差异在扩大 
这个假设。 

我从只有少数变量的模型开始。在这里，越简单越好。 
我想说明的重点是方法性的，我不想读者由于大量变量而忽 
略了这些方法上的重点。简单的模型就足以展示用参数变 
化模型分析重复调査的要点。一旦理解了这些要点，正如我 
所展示的那样，增加协变量以改善模型就是很容易的事。读 
者要记住，这个例子的主要目的是解释方法，而不是发展一 
个实质领域。 


民主党身份认同的种族差异 


表 6. 1汇报了在1973/1974年和1994年的美国综合调 



第 6 章发掘个人层次关系的变化 


査中，白人和黑人受访者各自认为自己有“很强的民主党人 
(认同感)”的百分比。这些百分比是来自有政党身份、种族 
和其他四个变量等数据的受访者 ( w = 55 81)，这四个变量分 
别是教育、地区、性别和年龄，它们将在以后作为协变量被纳 
人回归分析。因为1994年的美国综合社会调查的样本量为 
通常的两倍(在1994年美国综合社会调査改为两年调查一 
次），我合并了 1973年和1974年的调查。为了方便起见，我 
用1974年的调査指代1973年和1974年的调査。 


表 6. 1民主党身份认同的种族差异 *(1974 年对1994年) 


种 族 

百分比 

比 

数 15 

1974 

1994 

1974 

1994 

白人 

14.71 

10.48 

0. 1725 

0. 1171 

黑人 

33. 53 

40. 97 

0. 5044 

0. 6941 

百分比差别（白人一黑人） - 

-18. 82 - 

-30.49 



比数比（白人/黑人） 

1974年至1994年种族差异的变化 
以百分比 表示： 

— 30.49 —(— 18. 82) = -11. 67% 
以比数 表示： 0. 169/0. 342-0. 494 

0. 342 

0. 169 




注自我认定为“很强的民主党人(认同感)”。样本量为 5581(1973/1974 
年为2806, 1994年为2775)。样本包含所有在种族、政党身份和四个 
之后加人的协变量上没有缺失值的受访者，这四个协变量是教育、地 
区、性别和年龄。 

b . “比数”定义为 / >/(l —/>), 这里户是概率。因为/>等于百分数/100,比 
数在这里是由百分比计算而 来:比 数=百分数 /(100- 百分数)。 

为了方便进行 logistic 回归结果的比较，表 6. 1也报告了 
民主党身份认同的比数。表 6. 1报告的比数由百分数计算 
而来 ：比数 =百分数/(100_百分数）。例如，在1974年， 
14. 71%的白人受访者认为自己有很强的民主党人认同，其 
比数为 0.1725(14. 71/[100 — 14. 71] = 0.1725) 。 
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表 6.1 的结果显示，从1974年到1994年，民主党身份认 
同的种族差异变大了。1974年，白人相对于黑人民主党人身 
份认同的差异为18.82%: 14. 71%的白人认为自己有很强 
的民主党人认同，相对的，有 33. 53%的黑人这么认为。1994 
年，这一差异激增到 30. 49%： 10. 48%的白人认为自己有很 
强的民主党人认同，但有 40. 97%的黑人这么认为。 

从比数的角度说，白人认为自己有很强的民主党人认同 
的比数从1974年的 0. 1725下降到1994年的 0. 1171，而非 
洲裔美国人的比数从1974年的 0. 5044提髙到1994年的 
0.6941。白人/黑人比数比一白人认为自己有很强的民主 
党人认同感的比数与黑人认为自己有很强的民主党人认同 
感的比数之间的比率一从1974年的 0. 342 (0. 1725/ 
0. 5044) 下降到 1994年的 0. 169(0. 1171/0. 6941)。换言之， 
白人(相对于黑人)在1974年要乘以 0. 342才能有很强的民 
主党人认同感，而在1994年是乘以 0. 169。因此，在1974 
年，白人明显比黑人更不可能有很强的民主党人认同感，而 
在1994年，这一种族差异更显著了。 

请注意，白人和黑人在有很强的民主党人认同感的比数 
的比例从 0. 342下降到 0. 169。1994年的种族影响比20年 
前更大。在1994年（相对于1974年），白人要乘以比数 
0.494 才能有很强的民主党人认同感(表 6. 1)。因为白人在 
1974年已经比黑人更不可能有很强的民主党人认同,所以把 
比数比降低一半则进一步扩大了民主党身份认同的种族 
差异。 

下一步是检验表 6. 1报告的种族差异的统计显著性。 
虽然有多种方法来检验统计显著性，但最有指导意义的是把 
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民主党身份认同作为因变量进行 logistic 回归。用 logistic 回 
归来检验种族作用的统计显著性后，下一步很容易加入协变 
量来估计在控制了其他解释变量后种族的净作用。 

表 6. 2给出了 logistic 回归分析的结果。我们在表的标 
题中用术语“总作用”来强调没有控制变量下的作用。这个 
模型只是重复了表 6. 1报告的粗差别。这个模型是一个参 
数变化模型，交互项是种族乘以1994年，它允许民主党身份 
认同的种族差异在1974年和1994年不同。该模型可以写成 
如下 形式： 

= a + 7 A 4 +PX 种族 + SX D 94 X 种族 [6.7] 

此处，种族是一个虚拟变量 （1 = 白人）。请注意，这里的种 
族差异模型和前面讨论的地区差异模型在形式上是一样的。 
两者都只有四个参数 :截距 ( a ) 和三种截距差(7、 P 和 S )。 这 
种类型的模型是参数变化模型的最基本形式。 

表 6. 2报告了四个参数的估计。因为读者处理百分数 
的经验可能比处理比数的更多，表 6. 2首先把普通最小二乘 
回归分析和 logistic 回归分析的结果并列报告。 logistic 回归 
重复了表 6. 1中报告的比数，而普通最小二乘回归重复了表 
6.1 的百分数。我用普通最小二乘回归的结果来确定基本原 
则。在此重要的是要强调这个练习是作为教学，即展示怎么 
用最小二乘法来估计总作用模型以重现表 6. 1的粗百分数， 
而不是说我们认可用普通最小二乘估计来对二分的因变量 
进行回归。在那样的模型中， logistic 回归是更合适的估计统 
计显著性的方法。表 6. 2报告了普通最小二乘估计的显著 
性，只是为了让它们可以与 logistic 回归的估计相比较。 
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表 6. 2民主党身份认同的种族差异 *(1974 年对1994 年）: 
总作用的参数变化模型的回归结果 (N = 5581) 


自变量 

普通最小二乘回归 b 

logistic 回归 

C 

系数 

P 

logit 

比数比 

P 

表示1994年的虚拟变量 

7 4* 

0 006 

0 319* 

1. 376 

0 04 

种族 (1 =白人） 

— 18.8* <0.0001 

-1 074 * 

0 342 

<0 0001 

种族 X 表示1994年的虚 
拟变量 

-11.7* <0.0001 

-0 706 # 

0 494 

<0. 0001 

截距 d 

33.5* <0 0001 

-0. 6841* 

0. 5045 

<0. 0001 


注: &自我认定为“很强的民主党人(认同感)”。 

b. 普通最小二乘回归报告的系数可以用来重现表 6.1 的百分数 5 这些 
系数可以通过以下过程得到，即把二分变量 （1 =很强的民主党人认 
同感，0 =其他)回归到表示1994年的虚拟变量、种族和种族X表示 
1994年的虚拟变量，并把得到的系数乘以100,或者为避免给系数乘 
以100,可以把因变量编码为(0, 100)，而不是(0, 1)。 

c. 在这里，比数比是通过对 logn 取反对数(以 e 为底)而得到的。以上的 
比数比可以用来重现表 6. 1报告的比数(参照正文的详细介绍）。 

a 参照组，即 1974 年的黑人的系数(百分数或者 Iogn)。 

■ 表示 p < 0. 05。 

表 6. 1的百分数可以由普通最小二乘估计重现,只要给 
虚拟变量代人合适的值。对1974年的黑人，我 们有： 

E ( Dem ) = a + yD Si + (3 X 种族 + S X D 94 X 种族 

= 33. 5 + 7. 4(0) -18. 8(0)-11. 7(0) [6. 8] 

— 33. 5 

对于1994年的黑人，最后两项都为0, E ( Dem ) = a + yD 94 = 
33. 5 + 7.4 = 40. 9„对于1974年的白人，种族=1且 D 94 = 
0,所以 E < iDem ) = a +(3 X 种族= 33. 5 —18. 8 = 14. 7。对于 
I " 4 年的白人，种族=1且 D 94 = 1，所以 £( Cfem ) = a + 
yD M +PX 种族 + SD 94 X 种族= 33. 5 + 7. 4 — 18. 8-11.7 = 
10. 4。 
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这个练习展示了普通最小二乘回归的一项为人所熟知 
的规律 :当所 有的自变量都是虚拟变量时，最小二乘回归预 
测的是用虚拟变量建模的各个分类的均值。在因变量是二 
分编码(0, 100) 的特殊情况下，回归系数可恢复为实际的类 
别百分数。之所以如此，是因为百分数是以（0, 100) 编码的 
变量的均值。例如，如果五个受访者中有两个人有很强的民 
主党人认同感，那么均值是 (100 + 100+0+0+0)/5 = 40 = 
有很强的民主党人认同感的百分数。 

同样，用1呢戚^回归到虚拟的自变量上的结果也可用 
于恢复各类别的比数。首先考虑截距。截距是参照组 （1974 
年的黑人）的均值。在普通最小二乘法的情况下，截距是 
1974年的黑人中自认为有很强的民主党人认同感的人的百 
分数(方程 6. 8)。在 logistic 回归的情况下，截距是在1974 
年非洲裔美国人有很强的民主党人认同感的比数。因 
为 33. 5%的白人在1974年有很强的民主党人认同感，所以 
比数就是 33. 5/(100-33.5) = 0. 504,与表 6. 2的截距所给 
出的值一致(在四舍五人范围内）。 

现在考虑非洲裔美国人在1994年有很强的民主党人认 
同感的比数。从表 6. 1中，我们知道，比数从 0. 504提高到了 
0. 694。我们也可以从表 6. 2中发现比数在提高，如下 所示： 

logit ( IteTn ) = a + yD si + p X 种族 + S X D 94 X 种族 
=-0. 684 + 0. 319 D 94 - 1. 074 
X 种族一 0. 706 X 种族 XD m 
=-0. 684 + 0. 319(1) - 1. 074(0)—0. 706(0) 
=— 0. 365 

[6. 9] 
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-0. 365是非洲裔美国人在1994年有很强的民主党人认 
同感的 lo gl t (比数的对数）。把 logit 转化为比数，我们对 
—0.365 取（以 e 为底的）反对数 。 logit = —0.365 意味着比 
数= 365 = 0. 694。 

在方程 6. 9中，我们把 （ logit 的）冥相加，然后取反对数 
来得到比数。或者，因为 e x+y = 我们可以先取反对数， 
然后相乘(即 e - eO 而不是相加，再之后取反对数 ( e x+y )。 由方 
程 6. 9可知，对1994年的非洲裔美国人，有很强的民主党人认 
同感的比数是 0 684+0 319U)_1 074<0)_0 706(0) ) = e -° 684 e ° 319 e ° e ° = 
(0. 505)(1. 376)(1)(1) = 0. 695( 根据定义， e ° = 1)。 

把反对数相乘经常是更容易的方法，因为一般的 logistic 
回归软件在报告 logit 的同时报告反对数。这些反对数在 
表 6. 2中标记为“比数比”。任意一组比数可以通过将适当 
的比数比相乘而计算得到。例如，表 6. 2中的比数比暗示 
1994年非洲裔美国人的比数为 0. 695(0. 505 X 1. 376)。对 
黑人来说，从1974年到1994年，有很强的民主党人认同感的 
比数要乘以因子 1. 376,即明显提高了（比数从 0. 505提 
高到 0. 695)。 

白人的情况则很不同。对他们来说，从1974年到1994 
年，有很强的民主党人认同感的比数要乘以因子 （1. 376) 
(0.494) = 0.680,即下降了。这从表 6. 2报告的比数比可以 
得到： 

1974 年的白人的比数= (0. 505)(0. 342) [6. 10] 

1994年的白人的比数= (0. 505)(0. 342)(1. 376)(0.494) 

[ 6 . 11 ] 
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比较方程 6 . 10 和方程 6. 11， 很明显 ，1994 年的比数是 
1974 年的比 数乘以 （1. 37 6)(0. 4 94) 或 0. 680。 对白人来说， 
有很强的民主党人认同感的比数从 1974 年到 1994 年以因 
子 0 . 680 下降，而对非洲裔美国人来说，则以因子 1. 376 提 
高。因此，白人对黑人的比数的比率从 1974 年到 1994 年要 
乘以 0. 680/1. 376 = 0. 494。 

比数比 (0. 494) 的参数变化在统计上是显著的，显示从 
1974年到1994年，政党身份认同的种族差异发生了变化。 
系数 0.494 表示白人有很强的民主党人认同感的比数，相对 
于黑人有很强的民主党人认同感的比数，从19?4年到1994 
年要乘以0.494。因为白人在1974年已经比黑人更不可能 
有很强的民主党人认同感，所以白人对黑人的比数减半使得 
有很强的民主党人认同感的种族差异扩大了。我们由此得 
出结论，在1974年到1994年间，民主党身份认同的种族差异 
扩大了，至少从自认为有很强的民主党人认同感来说是 
这样。 [11] 

还有什么结论可以从表 6. 2中得出？首先，考虑表示 
1994年的虚拟变量的结果。参照组是1974年的黑人，所以 
表示1994年的虚拟变量的系数是比较1994年的黑人和 
1974年的黑人。（这个 ) logit 是正的且统计上显著，意味着黑 
人在1994年比在1974年有更强的民主党人认同感。换言 
之,黑人民主党认同感的 7. 4个百分点的提高(表 6. 1) 具有 
统计显著性。此外，考虑表示种族的虚拟变量的结果。因为 
参照组是1974年的黑人，所以这个 logit 比较的是1974年的 
白人和黑人。因为该 logit 是负的且统计上显著，所以我们得 
出结论，在1974年，白人比黑人更不可能有很强的民主党人 
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认同感。换言之，黑人和白人在1974年时的 18. 8个百分点 
的差异不太可能是抽样误差的结果(/ ><0. 0001 ) o ™ 

回归并没有告诉我们白人的民主党人认同感的下降是 
否在统计上显著。为了进行检验，我们需要把种族的编码对 
调(例子如下）。 


不同种族和教育水平者的民主党人身份认同 


我有意选择政党身份认同的种族差异扩大这个例子，来 
展示各群体的比数怎样从有分类自变量的参数变化模型的 
logu 系数中得到。在关于种族和政党身份认同的实际论文 
中，很自然，下一步是增加一系列协变量，看对民主党身份认 
同的种族差异是否能被这些协变量所解释。我推延这一步， 
先着重考察包含连续变量的参数变化模型的基本规律。以 
教育为例。控制了刚刚观察到的种族差异后，教育与民主党 
身份认同的关系在1994年和1974年有没有不同？为了研究 
这个问题，我在种族总差别的参数变化模型中加人教育和教 
育乘以1994的交互项。 

表 6. 3报告了结果。因为我们从一个所有自变量都是 
分类变量的模型，跳到了另一个有部分自变量不是分类变量 
的模型中，截距不能再被解释为参照组的均值。相应的，截 
距是参照组成员的预期值，这些参照组成员在连续变量上取 
值为0。因此,这个模型预测，对1974年没受过任何正式教 
育的非洲裔美国人来说,他们有很强的民主党人认同感的比 
数的对数为0.41。如果比数的对数为 0.41, 比数则为 〆 41 ， 
或者说是 1. 51，所以概率是 1. 51/(1.51 + 1) ，或者说 0. 60。 
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我们也得出结论， 0. 60的概率对1994年和1974年都适用， 
因为在表 6. 3中，表示1994年的虚拟变量没有达到统计显 
著性。 [13] 这个结果跟我们在表 6. 2中的发现不一致，在 
表 6. 2中，黑人在1994年比在1974年有更大的民主党人认 
同感的比数。 


表 6. 3民主党身份认同的种族和教育差异 *(1974 年对1994 年）: 
参数变化槙型的回归结果 ( N = 5581) 


自变量 

logit 

比数比 

P 

表示1994年的虚拟变量 

-0. 14 

0. 87 

0. 67 

种族 (1 =白人） 

—0. 94* 

0. 39 

<0. 0001 

种族 X 表示1994年的虚拟变量 

-0. 80* 

0. 45 

<0. 0001 

教育 

—0. 106 # 

0. 90 

<0. 0001 

教育 X 表示1994年的虚拟变量 

0. 055* 

1.06 

0. 03 

截距 

0.41* 

1 51 

0.04 


注: a . 自_评为“有很强的民主党人认同感”。 
•表示 p <0. 05。 


在模型中加入教育后，种族的作用不变，也就是说，白人 
比黑人更不可能有很强的民主党人认同感，且这个差异在增 
大。在教育水平不变的情况下，白人(相比于非洲裔美国人) 
在1974年要乘以比数 0. 39才能有很强的民主党人认同感， 
而在1994年则是乘以 （0. 39)(0. 45) = 0. 18。这些估计跟 
种族的总作用相似，它在1974年为 0. 342,在1994年为 
(0. 342)(0. 494) = 0. 169( 表 6. 1)。即使控制了教育的作 
用，民主党身份认同的种族差异还是扩大了。 

至于教育自身的作用，教育程度更高的人更不可能有很 
强的民主党人认同感。在1974年,教育年限每增加一年，要 
有很强的民主党人认同感就要乘以比数 0. 90。交互项教 
育 X 表示1994年的虚拟变量在统计上显著(^ = 0. 03)，显 
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示教育在1994年的作用与1974年不同。交互项的 logit 系数 
是1974年和1994年斜率的差别，因此1994年的预期 ( logit ) 斜 
率是1974年的斜率加上1994年的增长，即 一 ()• 106 + 0. 055 = 
— 0. 051。因为一 0. 051的反对数为 0. 95,所以我们可以说在 
这个样本里，在1994年，每增加一年教育，要有很强的民主 
党人认同感就要乘以比数 0. 95( 或者，我们可以由1974年教 
育作用的比数比 [0. 90] 乘以1994年教育作用的增长 [1. 06] 
而得到比数比 0. 95)。 

总而言之，从表 6. 3报告的结果，我们可以得出结论说. 
教育在1974年对民主党身份认同有相反的作用以< 
0.0001)，且教育的作用在1994年比在1974年弱 （/> = 
0. 03) 0 然而，从表 6. 3中，我们不清楚教育在1994年的作用 
是否在统计上显著。我们可以计算出教育在1994年的样本 
斜率并用 lo gl t 表示（见上)是_0. 051，但是我们缺乏对这个 
logit 的显著性检验。 

为了检验这个 logit 的显著性，我们可以把表示年份的虚 
拟变量的编码对调，重新估计这个参数变化模型。当表示年 
份的虚拟变量在1994年编码为0,而在1974年编码为1时， 
教育的 logit 系数就代表1994年的教育的预期作用，而不是 
1974年的作用。这就是我们想要检验显著性的系数(要了解 
另一种对调编码以检验显著性的方法，参见 Firebaugh &• 
Beck , 1994:脚注 12)。 

表 6. 4报告了参数变化模型的结果，其中年份的虚拟变 
量是1974年编码为1。事实上，教育在1994年的作用在统 
计上是显著的(/> = 0. 007,表 6. 4)。我们得到的 logit 系数 
是 一0. 052,与表 6. 3得到的计算结果 （一0. 106 + 0. 055) — 
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致。那么，在1994年，每增加一年教育，要有很强的民主党 


人认同感就要乘以比数° 52 ，或者说是 0. 95。 

表 6. 4民主党身份认同的种族和教胄差昇 *(1974 年对 1 W 4 年）： 
参数变化模型的回归结果(对调了年份虚拟变置的编码 , N = 5581) 


自变量 

logit 

比数比 

P 

表示1974年的虚拟变量 

0. 14 

1. 15 

0. 67 

种族 (1= 白人） 

-1. 74* 

0.18 

<0. 0001 

种族 X 表示1974年的虚拟变量 

0. 80* 

2. 22 

< 0. 0001 

教育 

-0. 052* 

0. 95 

0. 007 

教育 X 表示1974年的虚拟变量 

—0. 055 # 

0. 95 

0. 03 

截距 

0. 27 

1.31 

0.30 


注: au 自评为“有很强的民主党人认同感”。 
•表示 /><0.05。 


重复一点，表 6. 4的重点是要检验教育在1994年的作 
用的统计显著性。除了统计显著性这个问题，没有必要估计 
表 6. 4的模型，因为表 6. 4的自变量的 logit 和比数比可以从 
表 6. 3的系数中计算得来。然而，我把两个表都放在这里， 
是因为读者会发现对它们进行比较很有意义。例如，读者会 
发现，把年份的编码对调后，所有包含年份的 logit 的符号都 
对调了，包括年份自身、种族 X 年份和教育 X 年份。此外，对 
调了年份的编码后，也对调了模型中种族和教育的叠加作用 
的参照组一种族和教育的作用现在指的是1994年的种族 
和教育的作用，而不是1974年的。举例来说，种族的比数比 
是 0. 18( 表 6. 4)，是1994年的比数比，而不是1974年的 
比数比。 

我在此处加入表 6. 4,因为它也可以强调一点，即不要把 
直接检验作用的变化(正如在参数变化模型中所用到的）与 
对个别变化进行显著性检验混淆。有经验的研究者会注意 
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到这种 情况: 在群体 A 中，变量 X 的系数的值小于 0. 05, 
因此在 0. 05的显著性水平上，我们的结论是， X 对群体 A 有 
影响。在群体 B 中，系数稍小且/>值大于 0. 05,因此我们的 
结论是, X 对群体 B 没有影响，然而 X 的这两个系数之间的 
差别在统计上不显著。相反，即使两个系数各自并不显著, 
这个差别也可能在统计上显著（这种情况可能会出现，例如 
在一个样本的系数为正，另一个为负的情况下）。 

研究者要从中学到的是，由变量作用的统计显著性的变 
化来推论变量的作用的变化要特别小心。如果 X 在时点1 
的作用在统计上显著，而在时点2不显著，那么我们就不能 
推论说， X 的作用显著地变化了。参数变化模型提供了检验 
变量作用变化的直接方法，研究者如果想得出关于作用变化 
的结论，应该运用这些直接检验的方法，因为 X 的作用在统 
计显著性上的变化不能保证 X 的作用发生了显著的变化。 
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第6节 I 种族对民主党身份 
认同的净作用 


从逻辑上来说，研究种族在政党身份认同上的差异的下 
一步，是增加协变量来检验种族差异以及种族差异的扩大能 
否被黑人与白人之间的社会经济差异所解释。为了方便展 
示,我在表 6. 4报告的参数变化模型中加人了地区、性别和 
年龄(包括一次项和二次项，即年龄和年龄的平方)。这些协 


表 6. 5种族和教育对民主党身份认同的净作用 M 1974 年对1994 年）： 
参数变化模型的回归结果 (JV = 5581) 


自变量 

logit 

比数比 

P 

表示1994年的虚拟变量 

—0. 09 

0. 91 

0. 78 

种族 (1= 白人） 

-1.04 - 

0. 36 

<0. 0001 

种族 X 表示1994年的虚拟变量 

—0. 83* 

0. 44 

<0. 0001 

教育 

-0. 06* 

0. 94 

0. 0002 

教育 X 表示1994年的虚拟变量 

0.04 

1. 05 

0. 07 

地区 （1 =南方） 

0.07 

1.07 

0. 40 

性别 (1 = 女性） 

—0. 03 

0. 97 

0. 70 

年龄 b 

0. 04* 

1.04 

<0. 0001 

年龄的平方 b 

—0. 0002 

1. 00 

0. 11 

截距 

-0.91* 

0. 40 

0. 0004 


注: 自评为“有很强的民主党人认同感”。 
b . 年龄的测量为受访者的年龄减去16。 
•表示 p <0.05。 
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表 6. 6种族和教育对民主党身份认同的净作用 *(1974 年对1994 年）: 
参数变化横型的回归结果 ( 对调了年份虚拟变最的编码 , N = 5581) 


自变量 

logit 

比数比 

P 

表示1994年的虚拟变量 

0. 09 

1. 09 

0. 78 

种族 (1= 白人） 

-1. 87 - 

0. 16 

<0. 0001 

种族 X 表示1994年的虚拟变量 

0. 83 # 

2. 29 

<0. 0001 

教育 

— 0.02 

0. 98 

0. 40 

教育 X 表示1994年的虚拟变量 

-0. 04 

0. 96 

0. 07 

地区 （1 =南方） 

0.07 

1.07 

0. 40 

性别 （1 =女性） 

-0.03 

0. 97 

0. 70 

年龄 b 

0. 04 # 

1.04 

<0. 0001 

年龄的平方 b 

-0. 0002 

1. 00 

0. 11 

截距 

—1. 00* 

0.37 

0. 0008 


注: a * 自评为“有很强的民主党人认同感”。 
b . 年龄的测量为受访者的年龄减去16。 
表示 p < 0. 05。 


变量(还包括教育，它已经在模型中)在豪特、布鲁克斯和曼 
扎研究投票给民主党总统候选人的阶级差异时也被使用 
( Hout、Brooks &- Manza , 1"5)(关于该研究的详细内容，下 
一节将提到)。 

表 6. 5和表 6. 6报告了加人协变量后的结果(表 6. 5中 
年份是1994年编码为1，而表 6. 6中是1974年编码为1)。 
简言之，种族的净作用和总作用一样。加人协变量几乎不影 
响种族以及种族 X 1994年的系数。在美国，民主党身份认同 
的种族差异不能被种族在教育、地区、性别或年龄上的差异 
所解释。 
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第7节 | 参数变化模型的另一个 例子: 
阶级和民主党身份认同 


豪特、布鲁克斯和曼扎最近的研究展示了这样的证据, 
即“战后时期美国总统选举中阶级与投票行为的历史性重 
组” （ Hout 、 Brooks &- Manza , 1995:805)。 具体来说，从全国 
选举研究的数据中，他们发现了中产阶级的投票两极 分化: 
专业人员和技术人员对民主党候选人的支持增加，但企业管 
理人员和销售人员对其支持减少。 

只要把上面的种族的参数变化模型中的种族变量替换 
为对阶级的合适测量，我们就可以得到一个现成的检验方 
法，来检验中产阶级两极分化的论点是否被美国综合社会调 
査的数据中民主党身份认同的结果所支持。阶级和政党身 
份认同的例子在这里尤为合适，因为它显示了在自变量的取 
值为多分类时，如何运用参数变化模型。在这里，问题涉及 
的两个类别一专业人员/技术人员对企业管理人员/销售 
人员一内嵌于一个包含其他职业类别的阶级结构。在变 
量的取值是多分类时，我们的兴趣专注于其中两个类别在政 
党身份认同上的变化。 

对一个多分变量进行“有针对性的比较”有两种方法。 
第一种方法是把分析局限于我们感兴趣的类别之间的比较。 
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例如，在检验中产阶级两极分化的假设时，我们可以只分析 
中产阶级样本。第二种方法是纳人整个样本，把所有其他职 
业作为剩余分类加入研究。这时，所有除企业管理人员、销 
售人员、专业人员和技术人员以外的其他职业都成了一个 
“其他职业”的虚拟变量。为了方便教学，我使用这两种方法 
来分析中产阶级两极分化的假设。 

表 6. 7报告了三个职业类别(企业管理人员/销售人员、 
专业人员/技术人员和“其他职业”)在民主党身份认同上的 
总差别。表格报告了各群体自评为有很强的民主党人认同 
感的比数，比数由表中报告的百分数计算而来。从比数中， 

表 6.7 民主党身份认同的阶级差异 (1974 年对1994 年）： 百分数和比数》 


百分比 比数 

1974 1994 1974 1994 

中产阶级 (《 = 1840) 

企业管理人员和销售人员 
专业人员和技术人员 
其他职业 (n = 3353) 

相关的比数比 

1994年企业管理人员的比数:1974年企业管理人员的比数 0. 891 b 


专业人员的比数：企业管理人员的比数 (1974 年） 0. 813 b 

专业人员的比数：企业管理人员的比数 (1994 年） 1.553 

其他职业的比数：企业管理人员的比数 (1974 年） 1. 953 b 

其他职业的 比数： 企业管理人员的比数 (1994 年） 1. 640 

作用的变化、专业人员：企业管理人员 c 1. 91 b 

作用的变化、其他 职业： 企业管理人员 d 0 . 8种 


注 A 自评为“有很强的民主党人认同感”。样本量是5193。样本包括所有 
在职业、政党身份、性别、年龄和地区上没有缺失值的受访者。 

b . 比值在表 6. 8中是 logistic 回归的系数。 

c . 专业人员的比数：企业管理人员的比数,1994年的比值除以1974年 
的比值 (1 553/0.813)。 

d 1. 640/1. 953。 


10.38 

12. 54 

0.116 

0. 143 

11. 35 

10. 25 

0.128 

0. 114 

9. 44 

15.01 

0* 104 

0.177 

19.97 

15.72 

0. 250 

0. 187 
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我们很容易计算出我们感兴趣的类别的比数变化（在这里， 

专业人员/技术人员相比于企业管理人员/销售人员用“专业 
人员”相比于“企业管理人员”来缩写）。由此，比数的变化可 
以与用 logistic 回归分析的总作用模型中合适的参数变化项 
的比数比相比较。假设在这两个模型中，变量的编码是一致 
的，那么它们的估计也应该是一致的（在四舍五人范围内）。 

如果它们不一致，我们就需要找出出错的地方。 

研究的粗略结果似乎支持了中产阶级两极分化的假设。 
把中产阶级作为整体，有很强的民主党人认同感的比数增加 
了，从1974年的 0. 116提高到了 1994年的 0. 143。这个总 
体的增加掩盖了中产阶级内部的有趣差 别:企 业管理人员有 
很强的民主党人认同感的比数保持不变或者说稍微下降了， 

然而专业人员的比数则明显提高了。 

因此，两个群体在他们对民主党认同感的强度上对调了位 
置。在1974年，企业管理人员更可能有很强的民主党人认同 
感; 在1994年，专业人员则更可能有很强的民主党人认同感。 

然而，我们不知道这些样本差异在统计上是否显著。为 
了检验统计显著性，我们来看 logistic 回归的结果(表 6. 8)。 

跟之前一样，因变量是自评为有很强的民主党认同感的比数 
的对数。用“针对性比较”的方法，样本限制为职业类别为企 
业管理人员和专业人员的人。在这种情况下，样本量为 
1840,且有三个自变量 ：表示 1994年的虚拟变量，职业如果 
是专业人员或技术人员，其虚拟变量(“专业人员”)编码为1， 
如果是企业管理人员或销售人员则编码为0,以及参数变化 
项，专业人员 X 1994。用不限制职业类别的方法，所有职业 
都包括了，所以样本量更大 ( JV = 5193)，这时需要加入两个 
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针对性样本 b ( 仅中产阶级） 

A. 

0. 60 

0.39 

0. 03 

1 

1 

<0_ 0001 

比数比 

0. 89 

0.81 

1. 90 

1 


0. 128 

logit 

-0.11 

-0.21 

0. 64* 

1 


-2. 06* 

自变量 

表示 1994 年的虚拟变量 

表示专业人员的虚拟变量 

专业人员 X 1994 年 

表示其他职业的虚拟变量 d 

其他职业 X 1994 年 

截距 
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自变量，一个表示“其他职业”的虚拟变量（如果职业不是企 
业管理人员或专业人员，该变量编码为 1) 和一个参数变化 
项，即其他职业 X 1994。 

分析结果支持了中产阶级两极分化的 假设。 参数变化 
项专业人员 X 1994年在这里是重点。专业人员 X 1994年的 
比数比是 1. 90(^ = 0. 03,表 6. 8)。换言之，从1974年到 
1994年，专业人员有很强的民主党人认同感的比数相对于企 
业管理人员的比数的比率，以因子 1.90 发生变化。从表 6. 7 
来检验数值，专业人员对企业管理人员的比数比在1974年 
是 0. 813,在1994年是 1. 553,因此从1974年到1994年，专 
业人员对企业管理人员的比率要乘以 1. 553/0. 813,或者说 
是 1.91( 在四舍五人误差内）。 

表 6. 8也表明，在1974年，专业人员和企业管理人员在 
民主党身份认同上没有差别。在1974年，专业人员和企业 
管理人员的差别反映在表示专业人员的虚拟变量的系 数上： 
比数比是 0. 81，在统计上不显著。比数比的变化在统计上显 
著(专业人员 X 1994年）。如前面所解释的，这并不意味着 
在1994年，专业人员和企业管理人员之间的差别在统计上 
显著，所以我通过对调年份的编码来检验1994年的差别的 
显著性(不在此展 示）。 实际上在样本中，这个差别是显著的 
(比数比= 1. 55, p = 0. 02)。 

受限的和不受限的样本在这里得出了同样的结果。这 
个相同并不是偶然。虽然跟另一种方法相比，受限的样本使 
用了数据的子样本，但两种方法都是在估计相同的比数，也 
就是说，都是在估计专业人员和企业管理人员在1974年和 
1994年的民主党身份认同的比数。换言之，两种方法都是被 
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设计来重现表 6. 7的相关比数的（在四舍五人误差内），所以 
得出了相同的结果。 

既然针对性样本给出了一样的结果，为什么我们要用整 
个 样本？ 有两个原因。首先，整个样本给出了中产阶级以外 
的人在民主党身份认同上的趋势信息，因此我们可以把中产 
阶级两极分化的发现放在一个更大的背景下。回忆一下，专 
业人员 X 1994年是检验相对企业管理人员来说，专业人员 
在1974年至1994年间在民主党身份认同上比数的变化。同 
样，其他职业 X 1994年也是检验相同的比数比的变化，不过 
对应的是所有其他劳动者(非中产阶级)相对于企业管理人 
员的比数比。对非中产阶级劳动者相对于企业管理人员来 
说，比数比的变化在统计上不显著 (户 = 0. 45) 。而相对于企 
业管理人员来说，专业人员转向了民主党，然而这个转向看 
来并不是对民主党的一般性转向的一部分，如果我们把样本 
局限于专业人员和企业管理人员，我们将不会了解到这些情 
况。第二，使用整个样本一般可以更好地估计净作用。正如 
表 6. 8所展示的那样，两种方法都对总作用给出了一样的结 
果，因为两种方法都重复了表 6. 7中的比数比。然而，加人 
控制变量后，两种方法的结果一般不同，因为两个样本中对 
控制变量作用的估计一般不同。 

为了说明，我把教育加人中产阶级两极分化的模型中 
(表 6. 9 )。在査看表 6. 9时,记住在第一个回归中，对教育作 
用的估计是基于中产阶级受访者，在第二个回归中是基于整 
个样本。如果在两个样本中，教育的斜率完全一样，将会是 
极为罕见的情况。当教育作用的估计值不同时，我们预期其 
他解释变量作用的估计值也会不同(在这里确实不同），因为 
其他变量与教育相关。 
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第8节 I 总结与扩展 


第6章展示了一个用于在重复调查中研究解释变量作 
用的变化的模型。这个模型的决定性特征是它有交互项，其 
形式是 X 乘以 Dyr ， 在这里， X 是一个解释变量(分类变量或 
者连续变量）， Dvr 是一个表示调査的虚拟变量。这个模型简 
单，然而灵活。我们用美国综合社会调査的例子展示了这个 
模型的灵活性，并且解答了在使用模型中遇到的实际问题。 

重要之处在于，这个模型是用于记录变化，而不是解释 
变化，还需要进一步的分析或者用不同的模型一来解 
释观察到的变化。其中一种很有潜力的方法是把个人层次 
的参数作为随时间变化的宏观层次特征的函数 （DiPrete 
Grusky , 1990； Firebaugh &- Hayrue ， 待出）。这个方法模仿 
了研究学校作用的多层次方法 (Bryk & Raudenbush , 1992) ， 
只是在此，背景是时间，而不是学校。 

用多层次方法来職随时间变化的作用，首先是把个人层次 
的参数本身作为宏观层次变量的函数和一个随机扰动项。由于 
在宏观层次方程中有随机扰动项，所以多层次模型是一个随机 
效应模型，且普通最小二乘法不适用。前面描述的交互模型是 
一^固适纪应^型，因此(取决于因变量的特征)它可以用普通最 
小二乘法或 logistic 回归来估计。与之不同的是，多层次模型需要 
的估计方法超出了本书的范围 (DiPrete Ckrnky , 1990)。 


总结： 分析社会变迁 
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正如在序言中提到的，我曾想把本书命名为《如何用重 
复调査来分析社会变迁》。本书的核心是介绍四种方法来研 
究社会变迁。这些方法之所以不同，是因为它们提出了关于 
变迁的不同问题。 

第一种方法是趋势分析。趋势分析讨论的是在某些群 
体中， Y 的平均值是否随时间变化。因此，在趋势分析中， 
EOO 表达为时间的函数。因为这些是群体的趋势，而不是个 
人的，所以这里介绍的趋势分析是宏观层次的（对个人的趋 
势分析要求有固定样本数据）。很常见的情况是，我们的^ 
趣在于不同群体的趋势是趋同还是趋异。第3章介绍和演 
示了如何探索这个问题。 

第二种方法是对趋势进行近似分解。此时，关注点是社 
会变迁的近似原因，即有多少是由于个人的净变化带来的， 
有多少是由人口更替带来的？第4章介绍了两种分解方 
法-种基于线性回归，另一种基于代数。 

第三种方法是用其他变量自身和作用的变化来分解一 
个变量的变化。第5章介绍了按照这样的方法来分解总变 
化的一般模型。参数变化模型基于回归标准化的分解方程， 
但将之应用于对变迁的分解上，而不是群体差异的分解上。 
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第四种方法关注于个人层次上变量作用的变化。第 6 
章介绍了一个模型——参数变化模型——来研究个人层次 
的关系是否随时间变化。参数变化模型在表面上与研究趋 
势的趋同/趋异的模型相似（第3章），因为两个模型都有与 
时间的交互项，但相似点仅限于此。因为趋势是7的预期值 
随时间变化而发生的变化，时间在趋势分析中被看做连续 
的，且 E ( Y ) 表达为时间的函数。相反，参数变化模型把 
E ( Y ) 看做在离散时点上 X 的函数，在这里， X 对 ECH 的作 
用是时间的函数。 

因为时间本身并不是一个因果变量，趋势分析只是描述 
性的。此外，趋势分析通常只纳入有限的变量。例如，表 3.1 
报告的趋势分析只纳人了三个变量(但是使用了从1973年 
到1993年的美国综合调査）。在最简单的情形下，趋势分析 
是双变量的 ：变量 Y 和时间。但是，很常见的情况是，趋势 
分析的目的是研究不同人口子群体的趋势是否不同。在这 
种情况下，至少有三个变量 : 因变量 Y 、 时间和一个表示子群 
体的变量。在某些情况下，子群体反映了多个变量类别的分 
类。例如，菲尔鲍和哈雷检验了工作满意度在不同种族一性 
别群体中的情况（白人男性、白人妇女等 ）（Firebaugh &• 
Harley , 1995)。我们很少对多于两个或三个维度的交互分 
类的群体检验趋势，因为这会导致需要检验的趋势的剧增， 
以及伴随的各趋势的样本量减少。因此，趋势模型倾向于 
简洁。 

尽管趋势分析只需要少量变量，但它要求那些变量有多 
次测量。多次测量是这里的要点。变迁分解和参数变化分 
析都只要求两个时点(但通常纳入更多的变量），因此只重复 
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了一次或两次的调查可用于这里介绍的变迁分解和参数变 
化模型，但不能用于严格的趋势分析。谈及近似分解，世代 
更替的作用最适用于由多次测量来估计——在那种情况下， 
可以使用线性分解法一然而估计世代更替在两次调査间 
对变迁的贡献也是可行的(正如前面的多个例子所展示的那 
样）。除此之外，近似分解对数据的要求并不高。区分世代 
更替的贡献和个人变化的贡献，只需要测量三个变量 ：因变 
量、出生年份和调查年份。 

这四种方法——趋势分析、近似分解、变迁分解和参数 
变化模型一都利用了重复调査的重复性。这些模型提供 
了简单但有用的工具来研究社会变迁。但工具的价值最终 
要在使用中被证明，这些工具对研究社会变迁的价值也只有 
在社会科学家使用它们的时候才能实现。 



注释 


113 


注释 


[ 1 ] 重复调査的一个优点是，它们可以合并起来以获得足够的样本量，使我 
们可以研究通常难以进行分析的人口中的一些亚群体。例如，使用美 
国综合社会调査，我们可以研究天主教徒或离婚者，甚至是离婚的天主 
教徒。然而，因为需要时间来积累样本，这样的研究一般必须假定（自 
变量的)作用是随时间不变的。 

[2] 在某些情况下，世代的差别可能来自他们样本的相对大小。例如，一个 
相对较小世代的成员可能由于学校中班级的规模更小及进人就业市场 
的竞争更小而获益，此时对较大的世代来说，情况则相反。我们不着重 
于这种世代效应，因为与其他形式的世代效应相比，在实证上并不难将 
基于世代大小的作用与年龄和时期的作用区分开来。我们可以很简单 
地将世代大小作为一个变量加人测量了年龄和时期的模型。将其他形 
式的世代效应与年龄和时期作用区分开来要难得多。 

[3] 用美国综合社会调査的变量 OVERSAMP 加权，以便把在1982年和 
1987年以更大的权重抽取黑人的样本调整过来。 

[4] 因为这些估计假定了线性趋势，所以它们一般与基于首次调査本身的 
均值进行的估计不同。 

[5] 重要的是，不要把世代间的斜率决与世代效应相混淆， 因为决 可以反 
映年龄作用，也可以反映世代效应。 

[6] 参见 F ire ba Ug h, 1992。它讨论了为什么代数分解法在分解间隔较大 
时可能高估世代更替的作用。正如在这篇文章中讨论的，代数分解法 
用在间隔时间较短的调査中效果最好。要注意，将世代更替的部分进 
一步分解(例如，分解为源于进人和退出世代而导致的部分和源于在持 
续存在的世代里死亡率差异而导致的部分)并不那么直接。 

[7] 美国综合社会调査抽取的是家庭而不是个人，因此单身的成年人被抽 
取的权重更大。因为婚姻状况可能与性别角色态度相关，所以我用人 
口现状调査的婚姻状况数据对美国综合社会调査数据进行了加权。 

[8] 所有问题都编码为0或1。0 =传统态度的回应，因此均值的增加表示 
对传统态度支持的减弱。这个减弱不太可能主要来自对社会期望之回 
应的感知的变化。正如以下所揭示的，这种减弱很大程度上来自不同 
世代在性别角色态度上的不同，而不太可能是不同世代受社会期望的 
影响不同。（译者 注:“ 社会期望”指社会上对人们表达支持男女平等的 
期望。） 

[ 9 ] “1972年至1988年活着的一般成年人的变化”指的是那些出生于1899 
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年至1954年的人，因为美国综合社会调査的受访者年龄介于18岁到 
89岁。那么，为了估计一般的活着的人的变化，人们可能鲁莽地把那 
些世代作为一个组分开，用1988年的均值减去1972年的均值。然而， 
这个捷径无法估计活着的人的平均变化，因为它对1972年而非1988 
年，用了世代的比重(只)来计算1972年活着的人的均值^很显然，除 
非年长的和年轻的世代有一样的死亡率，否则1972年的 A 与1988年 
的会不同。 

[10] 特谢拉指出，在他的分析中加人参数变化项后，时间虚拟变量的系数 
(即截距)变得“无法解释” （ T eixeira ， 1987: 77)，所以他只汇报了叠加 
分解法的结果。无法解释的截距是前面描述的起点依赖问题的症结， 
起点依赖很可能是特谢拉的参数变化分析中遇到的问题。 

[11] 艾布拉姆森与同事分别汇报了 1952年到1992年全国选举研究数据中 
白人和黑人的政党认同。有趣的是，全国选举研究在1974年和1992 
年的数据在用“有很强的民主党人认同感”时，没有显示出种族差异的 
扩大。1974年相对于1992年，白人和黑人“有很强的民主党人认同感 
的百分比”的变化都几乎是0。研究美国综合社会调査和全国选举研 
究数据在这点上的区别不属于这里的分析的范畴。我分析美国综合社 
会调査数据中的种族差异，而全国选举研究数据中的种族差异问题留 
给其他人去研究。 

[12] 请注意，表 6. 2汇报的系数是基于用虚拟变量编码的自变量。这点值 
得强调，因为 logit 分析经常对分类变量使用效应编码，而不是虚拟编 
码。举例来说，不是把种族编码为1代表白人，0代表黑人，种族可以 
编码为1代表白人， 一1 代表黑人。效应编码可能产生一样的结果，但 
结果也可能看起来不同，因为自变量被賦予了不同的值。对于二分变 
量(正如表 6. 2那样），把用效应编码的 logit 乘以2就可将其转化为用 
虚拟编码得到的 logit . 

[13] 在表 6. 3里表示1994年的虚拟变量的样本 lo gl t 是一 0. 14。零假设 
为，总体的10皮1是0。当 logit 为0时，比数比为 1( 因为根据定义， e ° = 
1)。因此，与之等同的零假设则是比数比为1。很显然，比数比为1意 
味着没有作用，因为乘以1没有任何作用。例如，在表 6. 3的模型中， 
在1994年，一个没有受过任何教育的非洲裔美国人有很强的民主党人 
认同感的比数的估计值为 1. 51(1974 年的比数)乘以表示1994年的虚 
拟变量的比数比。因为我们无法拒绝零假设，即1994年的比数比为 
1，所以有 1. 51(1) = 1_51。 
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